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本 书 是 理论 计算 机 科学 方面 的 优秀 教材 ， 主 要 介绍 形式 语言 、 自 动机、 可 计算 性 和 相关 
内 容 。 本 书 特别 注意 定义 、 定 理 的 准确 性 和 严格 性 ， 在 定理 的 证 明 中 给 出 了 直观 的 动机 和 框 
架 ， 避 免 多 余 的 数学 细节 ， 这 有 利于 培养 学 生 形 式 化 和 严格 的 数学 推理 能 力 ， 加 强 对 问题 的 
理解 ， 本 书 通过 精心 设计 的 大 量 示例 ， 生 动 剖析 了 各 种 定理 和 定义 ， 概 念 清晰 ， 深 入 浅 出 。 
每 章 后 面 还 给 出 了 难度 不 同 的 习题 ， 并 给 出 部 分 习题 的 解答 ， 可 使 学 生 加 深 对 基本 原理 的 理 
解 并 增强 应 用 能 力 。 
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本 书 主 要 介绍 形式 语言 、 自 动机 、 可 计算 性 和 相关 内 容 。 主 要 内 容 包 括 : 计算 理论 导 
引 、 有 穷 自动 机 、 士 则 语言 与 正则 文法 、 上 下 文 无 关 语言 及 文法 、 下 推 自动 机 、 图 灵机 、 
形式 语言 和 自动 机 的 层次 结构 、 计 算 复杂 性 等 。 每 节 后 面 都 给 出 了 习题 ， 并 包含 部 分 习题 
的 解答 ， 方 便 教学 。 

本 书 是 理论 计算 机 科学 方面 的 优秀 教材 之 一 ， 可 作为 高 等 院 校 计算 机 专业 的 教材 ， 也 
可 作为 计算 机 系统 研发 人 员 的 参考 书 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 擎 出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 更 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流 担 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 人 迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 “ 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 始 ， 
华章 公司 就 将 丁 作 重点 放 在 了 以 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 奴 力 ， 我 们 与 
Prentice Hall ，Addison-Wesley，McGraw-Hill，Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum，Stroustrup ，Kernighan ， 
Jim Gray 等 大 师 名 家 的 -…- 批 经 典 作品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 废 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 届 力 训 助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迁 今 ,“ 计 算 机 科学 从 书 ” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 入 -个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 于 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
各 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 了 系列 组 成 
全美 经 典 学 习 指导 系列 "。 为 了 保证 这 三 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公 司 聘 请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交通 大 学 、 南 京 大 学 、 新 江 大 学 、 中 国 科 技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交 通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮 电大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 潮 
北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 *， 为 我 们 提供 选 题 意 见 和 出 版 监督 。 

这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
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的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I. T.，Stanford，U.C. Berkley，C. M. U, 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 训 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采 用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指 正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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译 者 序 


理论 计算 机 科学 是 推动 计算 机 技术 向 前 发 展 的 强大 动力 。 形 式 语 言 、 自 动机 、 可 计算 性 
和 相关 方面 内 容 梅 碟 的 计算 理论 ， 是 理论 计算 机 科学 的 基础 内 容 之 一 。 学 习 、 研 究 这 些 内 容 ， 
不 仅 为 进一步 学 习 、 研 究 理论 计算 机 科学 所 必需 ， 而 且 对 增强 形式 化 能 力 和 推理 能 力 有 重要 
作用 ， 这 些 能 力 对 从 事 计 算 机 技术 中 的 软件 形式 化 等 研究 ， 是 不 可 缺少 的 。 

本 书 是 由 美国 加 利 福 尼 亚 大 学 戴 维 斯 分 校 的 Peter Linz 教 授 编写 的 高 等 学 校 教材 ， 主 要 介 
绍 形式 语言 、 自 动机 、 可 计算 性 和 相关 内 容 。 本 书 特别 注意 定义 、 定 理 的 准确 性 和 严格 性 ， 
这 有 利于 培养 学 生 形式 化 和 严格 的 数学 推理 的 能 力 ; 本 书 强调 讲述 问题 、 定 理 时 的 直觉 性 ， 
这 有 利于 学 生 对 问题 的 理解 ; 本 书 在 定理 的 证 明 中 往往 只 给 出 框架 ， 而 略 去 细节 ， 这 有 利于 
学 生 进 一 步 思考 ， 加 强 对 问题 的 理解 ; 本 书 在 每 节 后 面 都 给 出 了 习题 ， 对 部 分 习题 还 给 出 了 
解答 ， 这 有 利 填 学生 通过 做 习题 加 深 对 基本 原理 的 理解 并 增强 应 用 能 力 。 本 书 是 理论 计算 机 
科学 的 优秀 教材 之 一 。 

本 书 可 以 用 作 计 算 机 理论 专业 和 计算 机 工程 专业 的 教材 ， 也 可 以 作为 计算 机 系统 研发 人 
员 的 参考 书 。 

引进 国外 的 优秀 计算 机 教材 ， 无 疑 会 对 我 国 的 计算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 
也 是 与 世界 接轨 、 建 立 世 界 一 流 大 学 不 可 缺少 的 条 件 。 我 们 把 本 书 介 绍 给 国内 从 事 计 算 机 教 
育 事业 的 同行 们 ， 以 供 参考 。 

本 书 第 1 版 于 1990 年 发 行 ， 这 个 译本 是 我 们 根据 它 的 第 3 版 翻译 的 。 参 加 本 书 翻译 的 有 : 
孙 家 晴 同志 负责 各 章 译 稿 的 详细 修改 和 全 书 的 统 稿 ; 郝 丹 同志 负责 第 1 章 到 第 5 章 的 翻译 ; 罗 
景 同 志 负 责 第 6 章 到 第 9 章 的 翻译 ; 李 炎 同志 负责 第 11 章 到 第 14 章 的 翻译 ; 孙 宏 涛 间 志 负责 第 
10 章 、 习 题解 答 及 索引 的 翻译 。 

由 于 我 们 的 能 力 有 限 ， 译 文中 难免 有 不 当 之 处 ， 散 请 读者 不 音 赐 教 。 


译 者 
2005 年 6 月 
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本 书 主要 介绍 形式 语言 、 自 动机 和 可 计算 性 等 相关 内 容 。 这 些 内 容 形成 计算 理论 的 主体 。 
这 方面 的 课程 现在 是 计算 机 科学 课程 体系 中 必 有 的 一 部 分 ， 并 且 这 门 课程 通常 开设 在 计算 机 
课程 的 早期 。 因 此 ， 这 本 书面 向 的 读者 主要 包括 计算 机 科学 系 或 计算 机 工程 系 大 学 二 年 级 和 
三 年 级 的 学 生 。 

学 习 本 书 的 预备 知识 包括 了 解 某 种 高 级 程序 设计 语言 (通常 包括 C、C++ 或 Java) ， 熟 悉 
数据 结构 和 算法 的 基础 知识 。 另 一 个 预备 课程 是 离散 数学 ， 包 括 集 合 论 、 国 数 、 关 系 、 逻 辑 
和 数学 推理 的 基础 。 这 门 课程 也 是 标准 的 计算 机 科学 导论 课程 的 一 部 分 。 

计算 理论 的 研究 有 几 个 目的 ， 其 中 最 为 重要 的 目的 包括 : (1) 使 学 生 熟 悉 计 算 机 科学 的 
基础 和 原则 ，(2) 为 后 续 课 程 做 准备 ，(3) 增强 学 生 进 行规 范 和 严格 数学 推理 的 能 力 。 尽 管 
我 在 这 本 书 中 采用 的 表达 方式 主要 是 为 了 达到 前 两 个 目的 ， 但 是 我 认为 这 本 书 也 达到 了 第 三 
个 目的 。 为 了 表达 得 更 加 清晰 ， 使 得 读者 能 够 认识 事物 的 本 质 ， 本 书 强调 直觉 上 的 动机 ， 并 
通过 例子 阐述 这 些 想法 。 只 要 可 以 选择 ， 我 就 会 选择 那些 容易 掌握 的 论据 ， 而 不 是 那些 简洁 、 
优雅 ， 可 是 在 概念 上 却 难以 理解 的 论据 。 我 在 这 本 书 中 准确 地 声明 定义 和 定理 ， 给 出 证 明 的 
动机 ， 不 过 省 略 了 程序 和 元 长 的 细节 。 这 样 做 是 出 于 教育 学 的 考虑 。 许 多 证 明 是 归纳 或 反 证 
的 一 般 应 用 ， 它 们 对 于 不 同 的 特殊 问题 而 言 也 不 同 。 这 样 的 详细 论证 不 仅 是 不 必要 的 ， 而 且 
会 影响 到 整体 的 流畅 性 。 因 此 ， 我 们 略 过 很 多 论证 的 细节 ， 可 能 会 有 人 出 于 完整 性 的 考虑 而 
质疑 这 种 做 法 ， 我 本 人 并 不 认为 这 是 一 个 缺陷 。 数 学 技巧 无 法 通过 阅读 别人 的 论证 过 程 而 培 ， 
养 出 来 ， 而 应 该 是 考虑 问题 的 本 质 ， 发 现 能 够 证 明 论点 的 想法 ， 然 后 通过 精确 的 细节 实现 它 。 
这 后 一 种 技巧 是 必 学 的 。 我 认为 这 本 书 的 论证 框架 提供 了 一 个 这 样 实践 的 正确 起 点 。 

从 事 计 算 机 科学 研究 的 学 生 有 时 把 计算 理论 方面 的 课程 视 为 非 必 需 的 ， 且 认为 它 缺 乏 实 
践 意义 。 为 了 说 服 他 们 ， 我 们 需要 吸引 他 们 的 兴趣 和 精力 ， 比 如 处 理 难 解 问题 的 坚韧 性 和 创 
造 性 。 为 此 ， 我 的 方法 强调 通过 解决 问题 来 学 习 。 

使 用 这 种 解决 问题 的 学 习 方法 ， 我 想 让 学 生 主要 通过 按 问题 分 类 的 示例 来 学 习 知 识 。 正 
如 它们 同 定理 和 定义 之 间 的 关联 性 一 样 ， 这 种 例子 通过 隐藏 其 后 的 概念 可 以 显现 其 动机 。 同 
时 ， 这 些 例 子 还 有 其 不 平凡 的 -一面 ， 它 们 有 助 于 学 生发 现 解决 方案 。 在 这 种 方法 中 ， 课 后 习 
题 更 有 助 于 学 习 过 程 。 每 个 章节 后 面 的 习题 阐明 和 解释 了 本 章 的 内 容 ， 在 不 同 的 层次 上 调动 
学 生 解 决 问题 的 能 力 。 其 中 一 些 习 题 相当 简单 ， 挑 选 了 一 些 书 中 没有 完成 讨论 的 内 容 让 学 生 
继续 进行 思考 。 另 一 些 习题 非常 难 ， 即 使 对 比较 聪明 的 学 生 也 是 一 种 挑战 。 这 两 种 习题 的 适 
当 结 合 会 成 为 非常 有 效 的 教学 手段 。 学 生 不 必 解 决 所 有 的 问题 ， 但 是 应 该 根据 课程 和 教师 的 
要 求 完成 部 分 习题 。 不 同 的 学 校 开设 的 计算 机 科学 课程 不 同 ， 有 的 强调 理论 方面 ， 有 的 几乎 
完全 面向 实际 应 用 。 倘 若 课程 选择 考虑 到 了 学 生 的 背景 和 兴趣 ， 那 么 我 相信 这 本 书 可 以 用 于 
上 述 任何 学 校 。 同 时 ， 教 师 需 要 告诉 学 生 他 们 期 望 学 生 能 够 做 到 的 抽象 程度 。 对 于 面向 论证 
的 习题 更 是 如 此 。 当 我 说 “证 明 ” 或 “表明 ”时 ， 我 认为 学 生 可 以 构造 出 一 个 论证 过 程 ， 然 
后 产生 一 个 清晰 的 结论 。 一 个 论证 过 程 要 形式 化 到 什么 程度 由 教师 决定 ， 而 且 这 种 指导 应 该 
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在 课程 的 早期 给 出 。 

这 本 书 的 内 容 适 合 在 一 学 期 内 完成 。 教 师 可 以 讲授 这 本 书 的 大 部 分 内 容 ， 不 过 ， 重 点 就 
由 教师 自己 决定 了 。 尽 管 这 本 书 中 证 明 不 多 ， 不 过 我 在 我 的 班级 里 通常 都 是 简 咯 地 讲述 这 些 
证 明 。 我 通常 只 给 出 足够 的 讲解 ， 使 结论 可 信 ， 然 后 让 学 生 独 自 去 阅读 剩 下 的 部 分 。 总 的 来 
说 ， 如 果 不 想 以 后 碰 到 困难 ， 还 是 尽 可 能 不 要 跳 过 某 些 章节 。 标 有 星 号 的 章节 可 以 略 过 ， 略 
过 这 部 分 内 容 不 会 影响 你 读 后 面 的 内 容 。 尽 管 如 此 ， 大 部 分 的 内 容 还 是 必需 的 ， 而 且 不 能 够 
跳 过 。 

这 本 书 的 第 1 版 出 版 于 1990 年 ， 第 2 版 出 版 于 1996 年 。 对 新 版 本 的 需求 是 令 人 高 兴 的 ， 这 
表明 我 的 这 种 通过 语言 而 不 是 计算 的 教学 方法 是 可 行 的 。 第 2 版 相对 于 第 1 版 的 变化 不 是 彻底 
的 变化 ， 而 是 在 原 有 基础 上 的 改进 。 它 修改 了 第 1 版 中 星 当 和 错误 的 内 容 。 无 论 如 何 ， 第 2 版 
看 起 来 已 经 相对 稳定 ， 需 要 进行 修改 的 地 方 也 很 少 。 所 以 ， 第 3 版 的 大 部 分 内 容 和 第 2 版 差 不 
多 。 第 3 版 主要 的 新 特点 是 增加 了 一 些 带 解答 的 习题 。 

最 初 ， 我 并 不 愿意 给 出 习题 的 解答 ， 因 为 这 样 就 会 减少 可 以 用 来 作为 课 后 练习 的 习题 数 
量 。 然 而 ， 几 年 来 ， 我 收 到 来 自 世界 各 地 学 生 的 求助 请 求 ， 因 此 我 决定 在 这 一 版 中 给 出 一 部 
分 习题 的 解答 。 我 又 增加 了 一 些 新 的 习题 从 而 保证 没有 解答 的 习题 的 数量 。 我 只 挑选 那些 有 
重要 指导 意义 的 习题 来 给 出 解答 。 因 此 ， 我 没有 仅仅 给 出 最 终 的 答案 ， 而 是 给 出 最 终结 果 的 
推理 依据 ,许多 习题 使 用 了 同样 的 原理 ， 我 通常 从 中 选择 具有 代表 性 的 习题 给 出 解答 ， 和 希望 
学 生 能 够 举 反 三 。 我 相信 挑选 出 来 的 这 部 分 习题 的 解答 可 以 帮助 学 生 提 高 他 们 解决 问题 的 
能 力 ， 并 且 保 留 一 部 分 比较 好 的 习题 给 教师 作为 课 后 作业 使 用 。 在 本 书 中 ， 有 解答 和 提示 的 
习题 都 标 有 车 。 

此 外 ， 为 响应 读者 的 建议 ， 我 把 一 些 比较 难 的 习题 做 了 标注 。 这 样 做 不 太 容 易 ， 毕 竞 习 
题 跨越 的 难度 范围 很 大 ， 而 且 同 样 一 道 习题 对 于 某 个 学 生 而 言 简单 ， 另 一 个 学 生 可 能 就 会 认 
为 很 难 。 但 是 仍然 存在 一 部 分 的 习题 ， 它 们 对 于 我 的 大 多 数学 生 而 言 都 是 有 挑战 性 的 。 这 部 
分 的 习题 我 用 一 -个 星 号 ( 砍 ) 标明 。 当 然 还 存在 一 些 特殊 的 习题 ， 它 们 没有 明确 的 答案 。 要 
想 解 决 它们 ， 可 能 需要 思索 ， 阅 读 一 些 附 加 内 容 ， 或 者 需要 一 些 计算 机 编程 。 虽 然 它 们 不 适 
合作 为 常规 的 作业 来 布置 ， 但 是 它们 可 以 作为 进一步 学 习 的 切入 点 。 这 种 习题 我 标 了 双星 号 
( 克 妆 )。 

在 过 去 的 10 年 里 ， 我 得 到 了 很 多 评论 家 、 教 师 和 学 生 的 有 益 建 议 。 这 样 的 人 太 多 ， 我 在 
这 里 无 法 一 一列 举 他 们 的 名 字 。 我 衷心 感谢 他 们 对 我 的 帮助 。 他 们 的 反馈 对 于 我 改进 这 本 书 
而 言 是 极其 宝贵 的 。 


Peter Linz 
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第 1 章 计算 理论 导 引 


计算 机 科学 是 一 门 实践 学 科 。 从 事 这 一 领域 的 人 经 常 是 那些 偏爱 解决 理论 中 有 用 而 切实 
的 问题 的 人 。 同 样 地 ， 计 算 机 科学 方向 的 学 生 主 要 对 解决 现实 世界 中 的 困难 感 兴 趣 。 只 有 当 
理论 问题 有 助 于 他 们 找到 好 的 解决 方案 的 时 候 ， 他 们 才 对 理论 问题 感 兴趣 。 这 种 态度 是 正确 
的 ， 因 为 没有 应 用 ， 谁 还 会 对 计算 机 感 兴趣 昵 。 但 是 ， 既 然 认 为 计算 机 科学 是 面向 实践 的 ， 
那么 人 们 不 禁 会 问 “ 为 什么 要 研究 理论 ? “ 

第 一 ， 理 论 提供 有 助 于 理解 学 科 一 般 本 质 的 概念 和 原则 。 计 算 机 科学 领域 包含 了 广泛 的 
特殊 课题 ， 从 机 器 设计 到 编程 。 在 现实 世界 中 成 功 地 应 用 计算 机 需要 学 习 大 量 特 殊 的 细节 。 
这 使 得 计算 机 科学 成 为 一 门 涉及 知识 宽泛 的 学 科 。 尽 管 计算 机 科学 涉及 多 方面 的 知识 ， 可 是 
仍然 存在 一 些 通用 的 基本 原则 。 为 了 研究 这 些 基 本 原则 ， 我 们 构造 了 计算 机 和 计算 的 抽象 模 
型 。 这 些 模 型 体现 了 硬件 和 软件 的 一 些 共同 的 重要 特点 ， 并 且 和 我 们 在 使 用 计算 机 工作 的 过 
程 中 碰 到 的 许多 特殊 和 复杂 的 构造 是 本 质 相关 的 。 即 使 当 这 些 模型 太 简单 而 不 能 立即 应 用 到 
现实 世界 中 时 ， 我 们 仍然 可 以 通过 研究 它们 获得 一 些 知 识 ， 为 特殊 的 应 用 提供 基础 。 这 种 方 
法 当然 不 是 仅仅 应 用 在 计算 机 科学 中 。 模 型 构造 是 任何 科学 学 科 的 本 质 之 一 ， 并 且 一 门 学 科 
的 有 效 性 往往 取决 于 其 简单 而 强大 的 理论 和 规律 。 

第 二 ， 我 们 讨论 的 想法 有 即时 和 重要 的 应 用 ， 这 点 或 许 不 是 很 明显 。 但 是 数字 设计 、 程 
序 设 计 语 言 和 编译 器 都 是 最 好 的 例子 ， 当 然 还 存在 着 很 多 其 他 例子 。 我 们 这 里 研究 的 概念 像 
线 一 样 贯穿 整个 计算 机 科学 ， 从 操作 系统 到 模式 识别 。 

第 三 ， 是 我 们 想 要 说 服 读者 。 这 个 学 科 在 智力 上 充满 刺激 和 乐趣 。 它 提出 了 许多 有 挑战 
性 的 、 让 人 迷惑 不 解 的 题目 ， 这 些 题 目 能 让 人 上 废寝忘食。 本质 上 ， 这 就 是 解决 问题 。 

在 这 本 书 中 ， 我 们 关注 那些 能 够 表现 所 有 计算 机 和 它们 的 应 用 特点 的 模型 。 为 了 能 够 给 
计算 机 的 硬件 建 模 ， 我 们 引入 了 自动 机 (automaton) (复数 : automata) 的 表示 。 自 动机 的 构 
造 包含 了 数字 计算 机 所 有 必 不 可 少 的 特点 。 它 接受 输入 ， 产生 输出 ， 可 能 还 有 临时 存储 空间 ， 
并 在 把 输入 转化 成 输出 的 过 程 中 做 出 决定 。 形 式 语言 (formal language) 是 对 程序 设计 语言 能 
一 般 特 点 的 抽象 。 形 式 语 言 包 括 符号 集 和 把 符号 组 成 称 为 句子 的 实体 的 构成 规则 。 一 种 形式 
的 语言 是 所 有 符合 构成 规则 的 符号 串 的 集合 。 尽 管 我 们 这 里 研究 的 某 些 形 式 语言 ， 它 们 要 比 
程序 设计 语言 简单 ， 但 是 它们 有 着 相同 的 本 质 特点 。 通 过 形式 语言 ， 我 们 可 以 获得 很 多 关于 
程序 设计 语言 的 知识 。 最 后 ， 我 们 通过 给 算法 (algorithm ) 一 个 精确 的 定义 来 把 机 械 计算 的 
概念 形式 化 ， 研 究 哪 些 问题 适合 用 机 械 方式 解决 ， 哪 些 不 适合 。 学 习 的 过 程 中 ， 我 们 将 展示 
这 些 抽象 表示 之 间 的 密切 关系 ， 研 究 我 们 从 中 可 以 获得 的 结论 。 

在 第 1 章 中 ， 我 们 从 一 个 宽广 的 视角 去 看 这 些 基 本 想法 ， 从 而 为 后 面 的 内 容 做 准备 。 在 1.1 
节 中 ， 我 们 复习 必需 的 数学 基本 知识 。 因 为 直觉 经 常 成 为 我 们 探究 问题 的 指南 ,所 以 我 们 得 
出 的 结论 应 该 以 严格 的 推理 为 基础 。 这 就 要 涉及 很 多 数学 工具 ， 但 是 并 不 会 涉及 得 过 多 。 读 
者 需要 掌握 集合 论 、 函 数 和 关系 的 术语 及 基本 结论 。 书 中 还 会 经 常用 到 树 结构 和 图 结构 ， 不 
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过 仅仅 需要 知道 带 标 记 图 和 有 向 图 的 定义 。 或 许 最 重要 的 要 求 是 能 够 理解 证 明和 形成 一 个 合 
理 的 数学 推理 。 这 包括 熟悉 演绎 、 归 纳 和 反 证 法 的 基本 证 明 技巧 。 我 们 假设 读者 已 经 具备 了 
这 些 必需 的 背景 知识 。 1.1 节 用 来 复习 一 些 在 后 面 的 章节 中 使 用 的 主要 结论 ， 并 建立 符号 表示 
基础 。 

在 1.2 节 中 ， 我 们 首先 关注 语言 、 文 法 和 自动 机 的 核心 概念 。 这 些 概 念 以 各 种 不 同 的 形态 
出 现在 书 中 。 在 1.3 节 中 ， 我 们 给 出 了 这 些 基本 概念 的 一 些 简单 应 用 ， 从 而 解释 这 些 概念 在 计 
算 机 科学 中 的 广泛 应 用 。 这 两 节 的 讨论 是 直观 的 ， 并 不 严格 。 在 后 面 ， 我 们 会 使 这 些 概 念 更 
准确 。 但 是 暂时 这 样 做 的 目的 是 为 了 更 加 清晰 地 描述 我 们 要 用 到 的 概念 。 

1.1 数学 预备 知识 和 表示 
1.1.1 集合 

集合 (set) 是 元 素 的 组 合 ， 除 去 成 员 资 格 关 系 ， 无 其 他 结构 。 我 们 用 xE5 表 示 x 是 集合 $ 的 
元 素 ，x 医 S 表 示 x 不 是 集合 S 中 的 元 素 。 集 合 在 大 括号 内 列 出 它 的 元 素 ， 例 如 ， 整 数 0，1，2 的 
集合 表示 成 

S$ = {0, 1,2} 
当 集 合 含 义 清楚 上 时， 我 们 可 以 用 省 上 略 号 和 其 内 的 元 素来 表示 和 集合 。 因 此，t{a, b, …, z} 代 表 所 
有 的 英文 小 写字 母 ， 而 {2, 4, 6, …} 代 表 所 有 的 正 偶数 。 如 果 需 要 的 话 ， 我 们 会 更 多 地 使 用 直 
接 表 示 ， 对 于 上 面 最 后 一 个 例子 ， 我 们 可 以 写成 
5 = {i:i>0,， i 是 偶数 } (1-1) 
通过 这 个 式 子 我 们 可 以 知道 “5 是 所 有 i 的 集合 ， 其 中 ，i 大 于 零 且 为 偶数 ”。 当 然 这 里 上 暗示 i 是 
整数 。 | 

通常 的 集合 运算 包括 并 (union， 表 示 成 U)、 交 (intersection， 表 示 成 人 站) 和 差 (difference， 
表示 成 -~ )， 它 们 的 定义 分 别 是 

SIUS; = {Xx : XES1 或 XES,} 
Sm = {x : XESI HxES,} 
S$S1—S,= {x:XxES HxXFS,} 

另 一 个 基本 运算 是 补 (complementation )。 集 合 S 的 补 表示 成 5， 包含 所 有 不 在 集合 5 中 的 
元 素 。 为 了 使 这 个 概念 有 意义 ， 我 们 首先 需要 知道 全 全 (universal set) U 包 含 哪 些 元 素 。 如 
果 给 定 U， 那 么 

S={x:xEU,x 5} 


设 有 元 素 的 集合 称 为 空 集 (empty set 或 null set)， 表 示 成 55。 根据 集合 的 定义 ， 显 然 有 





矿 蔓 理论 时 绚 3 


下 面 这 些 有 用 的 但 等 式 被 称 为 德 摩根 定律 (DeMorgan’s laws)， 在 有 些 情况 下 需要 使 用 
它们 : 
SUS,= SNMS, (1-2) 
$MS,= SU 5S, (1-3) 
如 果 集 合 5, 的 元 素 都 是 集合 5 的 元 素 ， 那 么 集合 $1 是 集合 S 的 子 集 (subset)， 记 作 
SCS 
如 果 5, 5， 但 是 5 包含 一 个 不 是 5; 中 的 元 素 ， 那 么 5, 是 5 的 真子 集 (proper subset)， 记 作 
SCS 
如 果 S, 和 52 没 有 共同 的 元 素 ， 即 51m5, = 8B， 那么 ， 这 两 个 集合 称 为 不 相交 (disjoint)。 
如 果 集 合 包 含有 限 个 元 素 ， 那 么 这 个 集合 是 有 限 的 ; 否则 ， 就 是 无 限 的 。 一 个 有 限 集合 
的 大 小 指 的 是 它 包 含 的 元 素 个 数 ， 记 作 |51。 
一 个 给 定 的 集合 通常 有 很 多 了 集 。 集 合 8 的 所 有 子 集 的 集合 称 作 集合 8 的 夭 全 (powerset)， 
记 成 2。 注 意 2 是 集合 的 集合 。 
例 1.1 如 果 集合 $ = {a, b,c}， 那 么 它 的 军 集 就 是 
2 = {9, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}} 
这 里 |S| = 3，|2”| = 8。 这 是 一 个 例子 的 一 般 结果 。 如 果 5 是 有 限 的 ， 那 么 
|25| = 2 口 
在 我 们 的 很 多 例子 中 ，- -个 集合 的 元 素 是 其 他 集合 元 素 的 有 序 排 列 。 这 个 集合 称 为 其 他 
集合 的 笛 卡 儿 积 (Cartesian product)。 两 个 集合 的 笛 卡 儿 积 是 有 序 对 的 集合 ， 表 示 成 
9=Sxo ={(x,)):xXES,yES,)} 
例 1.2 设 S = {2,4}，5, = {2,3,5,6}。 那 么 
5, x 5, ={(2,2),(2,3),(2,5), (2, 6), (4, 2),(4,3), (4, 5), (4， 6)} 
注意 上 述 书写 的 元 素 对 的 顺序 。 有 序 对 (4,2) 属于 集合 $, x 5,， 但 是 (2,4) 就 不 属于 。 
这 种 表示 显然 可 以 扩展 到 多 个 (大 于 两 个 ) 集合 的 第 卡 儿 积 。 通 用 的 定义 为 
XXX = {XX ES 口 


1.1.2 函数 和 关系 


也 数 (function ) 是 建立 一 个 集合 的 元 素 和 另 一 个 集合 的 唯一 的 一 个 元 素 对 应 关系 的 规则 。 
如 果 f 凌 示 一 个 函数 ， 那 么 第 个 集合 称 为 函数 /的 定义 域 (domain ) ， 第 二 个 集合 称 为 它 的 值 
域 (range)。 我 们 用 
三 3 一 人 


表示 函数 /的 定义 域 是 集合 5 的 子 集 ， 值 域 是 集合 5, 的 子 集 。 如 果 函 数 /的 定义 域 就 是 集合 5S, 本 
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身 ， 我 们 就 说 函数 /是 集合 S, 上 的 全 函数 (total function )j; 否则 就 是 部 分 函数 (partial function ) 。 
在 许多 应 用 中 ， 函 数 的 定义 域 和 值 域 是 正 整 数 集合 。 而 且 ， 我 们 经 常 只 对 函数 的 自 变 量 
变 大 时 所 表现 出 来 的 函数 行为 感 兴趣 。 在 这 种 情况 下 ， 理 解 变化 率 就 足够 了 ， 我 们 只 需要 使 
用 普通 的 数量 级 符号 表示 。 假 设 函 数 /(n) 和 g(n) 的 定义 域 是 正 整数 的 子 集 。 如 果 存 在 一 个 正 
整数 < 满足 : 对 于 所 有 的 ， 
f(n) « cg(n) 
那么 我 们 就 说 8 是 j 的 最 大 阶 (order at most)， 记 作 
f(n) = O(g(n)) 
如 果 
| /ol> clgCo| 
那么 g 是 f 的 最 小 阶 (order at least) ， 记 作 
f(n) = (8(n)) 
最 后 ， 如 果 存 在 常数 cl 和 c: ， 并 且 
clsg(Cols [Fals czls(C9| 
则 称 .和 8 等 价 (same order of magnitude ) ， 表 示 成 
f/(n) = O(g(n)) 
在 数量 级 表示 中 ， 我 们 忽略 乘法 的 常数 ， 以 及 随 着 a 增 大 可 以 忽略 的 低 阶 项 。 
例 1.3 设 
f(n)=2n’ +3n 


gm = 下 
h(n)= 1012 +100 


f(n) = O(g(n)) 
8(n) = (h(n)) 
f(n) = (h(n)) 
在 数量 级 表示 中 ，= 号 不 应 该 被 解释 成 相等 ， 数量 级 表达 式 不 能 像 普通 的 表达 式 那 样 对 
待 。 诸 如 这 样 的 写法 
O(n) + O(n) = 20(n) 
就 不 是 很 明智 ， 很 可 能 会 导致 错误 的 结论 。 然 而 如 果 使 用 正确 的 话 ， 数量 级 的 命题 是 有 效 的 ， 
这 一 点 我 们 可 以 在 后 面 关于 算法 分 析 的 章节 中 看 到 。 口 
一 些 函 数 被 表示 成 有 序 对 的 集合 
{(X1, yi1)， (Xa, y2)， 2} 
这 里, 是 函数 定义 域 的 元 素 ，y, 是 函数 值 域 中 对 应 的 元 素 。 使 用 这 样 的 集合 来 定义 函数 ， 任 
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意 x, 至 多 出 现在 有 序 对 的 第 一 个 元 素 处 一 次 。 如 果 不 满足 这 一 点 ， 那 么 这 个 集合 称 为 关系 
(relation )。 关 系 比 函数 的 概念 更 宽泛 : 在 函数 中 ， 定 义 域 中 的 每 一 个 元 素 在 值 域 中 都 恰好 有 
一 个 关联 元 素 ; 在 关系 中 ， 可 能 有 多 个 值 域 中 的 元 素 与 之 相关 联 。 

男 一 种 特殊 的 关系 是 等 价 (equivalence )， 它 就 是 通常 的 恒 等 关系 。 表 示 有 序 对 (x,y ) 
是 等 价 关系 可 以 写成 . 


X=y 
如 果 一 个 标 有 三 的 关系 满足 下 面 三 个 规则 ， 那 么 这 个 关系 是 等 价 关 系 : 
自 反 性 规则 
对 于 所 有 的 x-， 都 有 x 二 x 
对 称 性 规则 
如 果 x 三 y， 那 么 y= 
传递 性 规则 


如 果 x 三 y 并 且 y 三 z<， 那 么 x=z 
例 1.4 定义 在 非 负 整 数 集合 上 的 关系 


成 立 ， 当 且 仅 当 
xmod3=ynmod3 


根据 上 面 的 定义 可 以 得 到 2=5，12=0 和 0=36。 很 明显 ， 这 是 一 个 等 价 关系 ， 因 为 它 满足 自 
反 性 、 对 称 性 和 传递 性 。 口 


1.1.3 图 和 树 


一 个 图 (graph ) 包括 两 个 有 限 集合 ， 顶 点 (vertex) 集合 = {W mw 和 这 (edge) 
集合 已 = {ei, e, …, en}。 每 条 边 由 顶点 集 V 中 的 一 对 顶点 构成 ， 例 如 


ei = (Vj, Vi) 


是 -条 从 顶点 到 顶点 w 的 边 。 我 们 认为 边 e 对 于 *j 而 言 是 输出 边 ， 对 于 ww 而 言 是 输入 边 。 这 种 
构造 实际 上 是 有 向 图 ( digraph )， 因 为 我 们 把 每 条 边 都 关联 了 一 个 方向 (从 vw 到 yw)。 图 也 可 以 
被 标记 ， 这 个 标记 可 以 是 名 字 或 和 图 的 部 分 相关 联 的 其 他 信息 。 顶 点 和 边 都 可 以 被 标记 。 

图 的 这 种 结构 通常 以 图 表 的 方式 来 表现 。 在 图 表 中 ， 顶 点 表示 成 圆圈 ， 边 表示 成 连接 顶 
点 的 带 箭头 的 直线 。 图 1-1 中 描绘 的 图 包含 顶点 集合 {v1, v,, v3} 和 边 集合 {Vis v3), (v3, v1), (vy 
V2), (V3, v3)} 

一 个 边 的 序列 om 9), Gy, Vv …, (vs 加) 称 为 从 w 到 w 的 通道 (walk)。 通 道 的 长 度 指 的 是 从 
起 点 到 终点 经 过 的 边 的 数目 。 没 有 重复 边 的 通道 称 为 路 径 (path)。 没 有 重复 顶点 的 路 径 成 为 
简单 (simple) 路 径 。 一 个 从 顶点 w 出 发 又 回 到 该 顶点 的 无 重复 边 的 通道 称 为 以 为 始点 (base ) 
的 回路 《cycle)。 如 果 回 路 中 除了 作为 始点 的 顶点 以 外 没有 重复 的 顶点 ， 那 么 这 个 回路 是 简单 
的 。 在 图 1-1 中 ， (V1, V3), (vs, v2) 是 从 v, 到 vy, 的 简单 路 径 。 边 序列 (Vi V3), (V3, V3), (V3, 7 是 回路 ， 


[6] 
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但 不 是 简单 回路 。 如 果 图 中 的 边 被 标记 ， 那 么 我 们 就 可 以 谈论 通道 的 那个 标记 了 。 这 个 标记 
就 是 遍历 路 径 时 经 过 的 边 的 顺序 标号 。 最 后 ， 一 条 从 某 个 顶点 到 它 自 身 的 边 称 作 环 (loop )。 
在 图 1-1 中 ， 顶 点 v3 有 个 环 。 


" 全) 起 


图 1-1 


在 几 种 情况 下 ， 我 们 会 用 到 一 个 寻找 两 个 给 定 顶 点 间 所 有 简单 路 径 (或 以 某 一 个 顶点 为 
始点 的 所 有 简单 回路 ) 的 算法 。 如 果 不 考 虑 效率 的 话 ， 我 们 可 以 使 用 下 面 这 个 方法 。 从 某 个 
给 定 的 顶点 (假设 是 v;) 出 发 ， 列 出 所 有 的 输出 边 (w, v), (v;, v), … 这 样 ， 我 们 就 获得 了 所 有 
起 点 为 w， 长 度 为 1 的 路 径 。 对 于 所 有 这 样 到 达 的 顶点 w, vw, …， 只 要 输出 边 的 另 一 个 顶点 不 是 
已 经 构造 出 的 路 径 中 的 某 个 顶点 ， 我 们 就 可 以 列 出 所 有 的 输出 边 。 之 后 ， 我 们 就 获得 了 所 有 
始点 为 w， 长 度 为 2 的 简单 路 径 。 继续 上 述 过 程 直到 不 可 能 增加 新 的 顶点 为 止 。 因 为 顶点 的 数 
目 是 有 限 的 ， 所 以 我 们 最 终 会 列 出 所 有 起 点 是 v 的 简单 路 径 。 从 这 些 路 径 中 ， 我 们 选 出 那些 以 
给 定 的 另 一 顶点 为 终点 的 路 径 。 

树 是 一 种 特殊 的 图 。 树 是 一 个 没有 回路 的 有 向 图 。 在 这 个 图 中 ， 有 一 个 唯一 的 顶点 ， 称 
为 根 结 点 〈root)， 从 根 结 点 到 任何 一 个 其 他 顶点 只 有 唯一 的 一 条 路 径 。 这 个 定义 告诉 我 们 ， 
根 结 点 是 没有 输入 边 的 ， 而 且 树 中 存在 一 些 没 有 输出 边 的 顶点 。 这 些 没 有 输出 边 的 顶点 就 是 
树 的 叶 结 点 (leave)。 如 果 从 顶点 vi 到 顶点 存在 边 ， 那 么 v 就 是 v 的 父 结 点 (parent),v 是 v 的 
子 结 点 (child)。 每 个 结 点 的 层 数 (level) 指 的 是 从 根 结 点 到 该 结 点 的 路 径 的 边 数 。 树 的 高 度 
(height) 指 的 是 所 有 结 点 的 最 大 层 数 。 这 些 术语 在 图 1-2 中 以 图 例 的 方式 进行 了 解释 。 





图 1-2 


有 时， 我 们 想 要 把 每 层 的 结 点 和 一 定 的 顺序 相 联系 ， 这 种 情况 的 树 ， 称 为 顺序 树 (ordered 


tree )。 


关于 图 和 树 的 更 多 知识 可 以 在 离散 数学 书 中 获得 。 
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1.1.4 证 明 方 法 


阅读 这 本 书 的 一 个 重要 目的 是 培养 证 明 问 题 的 能 力 。 在 数学 证 明 中 ， 我 们 应 用 演绎 推理 
中 许多 已 被 接受 的 规则 ， 而 且 许 多 证 明 只 不 过 是 这 些 规则 的 一 个 序列 。 有 两 种 特殊 的 证 明 方 
法 经 常 被 使 用 ， 因 此 有 必要 先 简要 地 复习 一 下 它们 。 它 们 是 归纳 证 明 (proof by induction) 和 
反 证 法 (proof by contradiction )。 

归纳 证 明 是 根据 一 些 特殊 的 例子 的 正确 性 来 推出 更 多 命题 的 正确 性 的 方法 。 假 设 我 们 需 
要 证 明 一 个 命题 序列 Pi, P,,… 是 正确 的 。 而 且 假 设 下 面 的 条 件 成 立 : 

1. 对 于 某 个 k> 1， 我 们 已 知 Pi, P,,…, Pi 是 正确 的 。 

2. 对 于 任何 n >k，P1, P,, …, P, 正 确 都 有 P; ,1 正确 。 

我 们 可 以 使 用 这 种 归纳 的 方法 来 证 明 这 个 序列 中 的 每 一 个 命题 都 是 正确 的 。 

在 归纳 证 明 中 ， 我 们 是 这 样 证 明 的 : 根据 条 件 1， 我 们 知道 前 个 命题 都 是 正确 的 。 然 后 
条 件 2 告诉 我 们 Pi , :也 一 定 是 正确 的 。 既 然 我 们 知道 前 上 + 1 个 命题 是 正确 的 ， 我 们 应 用 条 件 2 
就 可 以 证 明 P , ;也 一 定 是 正确 的 ， 依 此 类 推 。 我 们 不 必 详 细 地 完成 这 个 证 明 过 程 ， 因 为 这 个 
证 明 模 式 很 清楚 。 这 样 的 系列 推理 可 以 扩展 到 任何 命题 。 因 此 ， 每 个 命题 都 是 正确 的 。 

开始 的 这 些 命题 P, P,, …, Pi 是 归纳 的 基础 (basis )。 从 已, 到 己 , ,的 步 又 之 间 的 联系 是 归纳 
步骤 (inductive step)。 使 用 Pi, P,, …, 已 是 正确 的 归纳 假设 (inductive assumption ) ， 使 得 归 
纳 步 又 变 得 更 加 容易 。 在 形式 化 归纳 证 明 中 ， 我 们 更 加 明确 地 表现 这 三 部 分 。 

例 1.5 ”二 元 树 指 的 是 不 存在 父 结 点 有 两 个 以 上 的 子 结 点 的 特殊 树 。 证 明 高 度 为 的 二 元 
树 至 多 有 2 个 叶 结 点 。 

证 明 : 如 果 我 们 将 一 个 高 度 为 z 的 二 元 树 的 最 大 的 叶 结 点 数 表 示 为 Ka ， 那 么 我 们 需要 证 明 的 
就 是 
ln) & 2" 


归纳 基础 : 因为 高 度 为 0 的 树 除了 根 结 点 以 外 没有 其 他 结 点 ， 即 : 这 棵 树 至 多 有 一 个 叶 结 点 。 
所 以 ， 显然 1(0) = 1 = 2°。 
归纳 假设 : 对 于 i = 0, 1,…,n， 有 I/(?) < 2'。 
归纳 步骤 : 由 - -个 高 度 为 的 二 元 树 构 造 一 个 高 度 为 n+ 1 的 二 元 树 。 我 们 最 多 可 以 用 两 个 叶 结 
点 来 代替 以 前 的 每 一 个 时 结 点 。 因 此 ， 
ln + 1) = 2 

这 样 ， 使 用 归纳 假设 就 可 以 得 到 

ln+1)&2x2"=2"°+1 


因此 ， 我 们 证 明 了 n + 1 时 结论 也 是 正确 的 。 既 然 4 可 以 是 任何 数 ， 这 个 命题 对 于 所 有 的 n 都 成 
立 。 图 口 
我 们 在 这 里 引进 国 符 号 来 表示 证 明 的 结束 。 
例 1.6 证 明 


s, -> (1-4) 


[9 





[1 


首先 ， 我 们 已 知 
9 1 一 9 十 严 十 卫 


然后 我 们 建立 归纳 假设 ， 认 为 式 (1-4) 对 于 成立。 如 果 是 这 样 的 话 ， 就 有 


_ (n+D) 


S +n+l 


n+l 


_ (n+2)n+l) 
2 


因此 式 (1-4) 对 于 5,, |, 成立。 至 此 我 们 已 经 完成 了 归纳 步骤 的 证 明 。 由 于 式 (1-4) 对 于 n= 1 
是 显然 成 立 的 ， 因 此 我 们 有 了 归纳 基础 ， 到 此， 通过 归纳 证 明了 对 于 所 有 的 n 都 成 立 。 口 

在 最 后 的 例子 中 ， 我 们 在 验证 归纳 基础 、 归 纳 假 设 和 归纳 步骤 上 都 不 是 十 分 形式 化 ， 但 
是 ， 我 们 仍然 列 出 了 它们 ， 因 为 它们 是 必需 的 。 为 了 防止 后 续 的 讨论 过 于 形式 化 ， 我 们 会 更 
倾向 于 使 用 第 二 个 例子 的 风格 。 无 论 如 何 ， 如 果 你 在 完成 或 构造 证 明 过 程 方面 有 困难 的 话 ， 
可 以 回头 看 形式 更 加 清楚 的 例 1.5。 

归纳 推理 可 能 并 不 容易 掌握 ， 但 注意 到 程序 设计 中 的 递归 和 归纳 的 紧密 联系 会 对 我 们 有 所 帮 
助 。 例 如 ， 函 数 fn) (nn 是 任意 正 整 数 ) 的 递归 定义 包含 两 部 分 。 一 部 分 是 根据 f(n), fln 1), …， 
f(1) 来 定义 f(n + 1)， 这 个 相当 于 归纳 步骤 。 第 二 部 分 是 通过 非 递归 的 定义 了 (1), 有 2), …, LR) 来 
从 递归 中 “跳出 ”。 这 个 相当 于 归纳 基础 。 正 如 归纳 证 明 一 样 ， 递 归 给 定 某 些 初 值 ， 依赖 问题 
的 递归 本 质 ， 从 问题 的 所 有 实例 中 得 出 结论 。 

反 证 法 是 另外 一 种 强 有 力 的 技巧 ， 在 其 他 证 明 方法 都 不 奏效 的 情况 下 ， 它 可 以 胜任 。 假 
设 我 们 想 要 证 明 某 个 命题 P 是 正确 的 。 我 们 就 假设 ， 在 某 一 时 刻 P 是 错误 的 ， 然 后 看 这 个 假设 
会 得 出 什么 样 的 结论 。 如 果 我 们 获得 一 个 已 知 错误 的 结论 ， 那么 我 们 就 会 怀疑 最 初 的 假设 ， 
从 而 证 明 P 一 定 是 正确 的 。 下 面 是 一 个 经 典 的 例子 。 

例 1.7 ”一 个 有 理 数 可 以 表示 成 两 个 正 整数 na 和 mm 的 比 ， 并 且 这 两 个 正 整数 没有 大 于 1 的 公 
共 因 子 。 如 果 某 个 数 是 实数 ， 但 不 是 有 理 数 ， 我 们 称 它 为 无 理 数 。 证 明 V2 就 是 无 理 数 。 

按照 反 证 法 ， 假 设 我 们 要 证 明 的 命题 的 反 命题 。 这 里 我 们 假设 V2 是 有 理 数 ， 那 么 它 就 应 
该 可 以 写成 

n (1-5) 
2 


这 里 x 和 m 都 是 整数 ， 并 且 没 有 大 于 1 的 公共 因子 。 重 新 整理 式 (1-5)， 我 们 得 到 
2m? = m2 

因此 一定 是 偶数 ，n 一 定 是 偶数 。 既 然 n 是 偶数， 那么 我 们 就 可 以 写成 x = 2k， 则 可 以 得 到 
2m? = 4 

即 
m’ = 2 

因此 m 是 偶数 ， 但 这 就 和 我 们 的 假设 一 一 n 和 m 没 有 大 于 1 的 公共 因子 一 - 相 矛 盾 。 所 以 ， 式 

(1-5) 中 的 m 和 n 不 存在 ， 即 V2 不 是 有 理 数 。 口 





事实 相 矛 盾 的 结论 。 如 果 我 们 论证 的 所 有 步骤 都 是 符合 逻辑 的 ， 那 么 就 会 得 出 我 们 的 初始 假 
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这 个 例子 展示 了 反 证 法 的 基本 证 明 过 程 。 通 过 作 某 种 假设 ， 我 们 得 到 一 个 与 假设 或 已 知 


” 设 是 错误 的 。 


习题 


1. 


和 wb 


对 5 的 大 小 作 归 纳 ， 证明: 如 果 5 是 有 限 集合 ， 则 |25| = 28 


.证 明 : 如 果 $S 和 5 是 有 限 集合 ， 并 且 |S| 三 7， |S,| =m, 那么 |SiUSa| N+m, 


如 果 S 和 5S 是 有 限 集合 ， 证 明 |S x Ss| = |Sils)| 。 

5 三 $, 当 且 仅 当 |S,|=|5,|， 证 明 这 是 个 等 价 关系 。 

证 明 德 摩根 定律 ， 即 式 (1-2) 和 式 (1-3)。 克 

有 时 交 运 算 和 并 运算 的 符号 与 求 和 符号 类似， 我 们 用 类 似 的 表示 法 来 定义 几 个 集合 的 交 运 
算 


Us -SUuS US … 








pL Tk 
使 用 这 种 表示 ， 通 用 的 德 摩根 定律 可 以 写成 
Us, 一 (5, 
PEP PEP 
和 
Ns, 一 Us, 
PEP PEP 


证 明 当 P 是 有 限 集 合 时 这 些 恒等式 成 立 。 类 


:证明 SUS -np 。 
.证 明 S = $5; 当 且 仅 当 (5 站)U(5 ns,)=5。 
.证 明 9 Us -Cn =- 。 大 


10. 证 明 S x(9 US )=(S x5,)U(S x9)。 


一 ”一 
-Oo 


.证 明 : 如果 5.55,， 那 和 有 S55。 
.给 出 满足 下 面 等 式 的 集合 S, 和 5;， 
$1 = (SiUS?) 一 5, 物 

证明: 如 果 fln) = O(g(n))， 并 且 g(n) = O(f(n))， 那 么 fln) = B(g(n))。 
. 证明: 2" = 0O(3”)， 但 2 OQ(3")。 
. 证明 下 面 的 数量 级 结果 成 立 : 

(a) m+ 5 log n= O(n’) 

(b) 3 = O(n!) 

(c) ml = O(n 各 


: 证明: 如 果 f(n) = O(g(n)),， 并 且 g(n) = O(h(n))， 那么 f(n) = O(h(n))。 
.证 明 : 如果 f(n) = O(n”)， 并 且 g(n) = O(mw)， 那 么 


fn) + g(n) = O(n’) 
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fln)g(n) = O(n®) 


18. 在 习题 17 中 ，g(n)/f(n) = O(n) 是 否 成 立 ? 
19. 假设 f(n) = 2n? + n, 8(n) = O(n*)， 下 面 的 证 明 哪 里 有 问题 ? 


由 于 
f(n) = O(n’) + O(n) 
因此 
f(n) — g(n) = O(n’) + O(n) - O(n’) 
所 以 


f(n) ~ g(n) = O(n) 
20. 以 人 yi4, v2, 99) 为 顶点 ， 以 {4 DO oO 73), (V2 1), (v3, 5) 为 边 绘 制 一 幅 图 。 列 举 所 
有 以 ”为 始点 的 回路 。 


21. 已 知 图 G = (V. E)， 证明: 
如 果 在 v,EV 和 vjEV 之 间 存 在 通道 ， 那 么 在 这 两 个 顶点 之 间 一 定 存在 长 度 不 大 于 |V| - 1 的 路 
径 。 
22. 任何 两 个 顶点 之 间 至 多 有 “一 条 边 的 图 ， 证 明 在 这 个 图 中 有 n 个 顶点 的 情况 下 ， 它 至 多 有 下 
23. 证 明 : 
a Ea n(n+ IQn+l) 
>» 6 
24. 证 明 : 


| 1 
Dr 
25. 证 明 : 对 于 所 有 n>4， 都 有 不 等 式 2*<n! 成 立 。 
26. 证 明 V8 不 是 有 埋 数 。 
27. 证 明 2- V2 是 无 理 数 。 兽 
28. 证 明 下 面 命题 的 正确 性 或 不 正确 性 。 
(a) 有 理 数 和 无 理 数 的 和 一 定 是 无 理 数 。 
(b) 两 个 正 无 理 数 的 和 -一 定 是 无 理 数 。 
(c) 有 理 数 和 无 理 数 的 乘积 一 定 是 无 理 数 。 
29. 证 明 每 个 正 整数 都 可 以 表示 成 质数 的 乘积 。 蚕 
广 30. 证 明 所 有 质数 的 集合 是 无 限 的 。 
31. 一 个 质数 对 由 两 个 相差 为 2 的 质数 构成 。 存 在 很 多 质数 对 ， 比 如 ，11 和 13，17 和 19， 等 等 。 
质数 三 元 组 指 的 是 二 个 数 n, n + 2, n + 4 都 是 质数 。 证 明 仅 有 的 质数 三 元 组 是 (1, 3， 5) 和 
(3,5,7)。 


1.2 三 个 基本 概念 
这 三 个 概念 是 这 本 书 的 主题 ， 它 们 分 别 是 : 语言 (language)， 文法 (grammar) 和 自动 


oa 
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机 (automata)。 在 学 习 这 门 课 的 过 程 中 ， 我 们 将 探讨 关于 这 些 概念 的 许多 结论 以 及 它们 之 间 
的 关系 。 首 先 ， 我 们 必须 理解 这 些 术 语 的 含义 。 


1.2.1 语言 


我 们 都 熟悉 自然 语言 (比如 : 英语 和 法 语 ) 的 表示 。 然 而 ， 我 们 大 多 数 人 可 能 发 现 准确 
解释 “语言 ”是 什么 仍然 很 困难 。 字 典 中 非 形式 化 地 定义 语言 为 一 个 用 来 表达 某 些 想法 、 事 
实 或 概念 的 系统 ， 这 个 系统 包括 符号 集 和 制定 的 规则 。 尽 管 这 个 定义 给 我 们 提供 了 语言 的 直 
观 描绘 ， 但 是 对 于 形式 化 语言 的 研究 而 言 这 个 定义 还 是 不 够 的 。 我 们 需要 一 个 更 准确 的 定义 。 

首先 我 们 给 出 一 个 有 限 的 、 非 空 的 符号 集合 了 ， 称 为 字母 表 (alphabet)。 使 用 单个 符号 
可 以 构造 出 符号 事 (string )， 这 个 符号 串 是 字母 表 中 符号 的 有 穷 序 列 。 例 如 ， 如 果 字 母 表 是 
> = {a, b}， 那 么 abab 和 aaabbba 都 是 > 上 的 符号 串 。 除 了 特殊 情况 ， 我 们 一 般 使 用 小 写字 母 
a,b,c,… 来 表示 中 的 元 素 ， 使 用 u,v, w,… 来 表示 符号 串 的 名 字 。 例 如 ， 我 们 使 用 


w = abaaa 


来 表示 名 为 w 的 符号 串 ， 它 的 值 为 apaaa。 
符号 种 w 和 ?的 连接 (concatenation ) 是 把 v 添 到 w 的 右 端 。 即 如果 . 
w = day a, 


v= bib, “ob, 


那么 w 和 v 的 连接 ， 表 示 成 wv， 就 是 


wv = aiq"ianbib,y…b 


符号 串 的 送 (reverse) 是 把 符号 串 中 的 符号 按照 相反 的 顺序 列 出 。 如 果 w 是 上 面 提 到 的 那个 符 
号 串 ， 那 么 它 的 逆 w* 就 是 


w" = Un"* dal 


符号 串 w 的 长 度 (length)， 记 成 lo|， 指 的 是 符号 串 中 包含 的 符号 个 数 。 我 们 经 常 使 用 到 
空 事 (empty string)。 空 串 中 没有 任何 符号 ， 用 4 表示 。 对 于 所 有 的 符号 串 w， 都 有 如 下 关系 
成 立 

出 =0 


Aw=wA=w 


符号 串 w 中 的 任何 连贯 的 符号 构成 的 符号 串 称 作 w 的 子囊 (substring)。 如 果 w = v4， 那 么 
子 串 v 和 子 串 zx 分 别称 为 w 的 前 组 (prefixz) 和 后 缓 (suffix)。 例 如 ， 如 果 w = abbab， 那 么 {4, a 
ab, abb, abba, apbap} 是 w 所 有 前 组 的 集合 ， 而 bapb, ab, 5 都 是 它 的 后 缀 。 

符号 串 的 简单 属性 ， 比 如 它们 的 长 度 ， 是 非常 直观 的 ， 因 此 可 能 不 需要 详细 介绍 。 例 如 ， 
如 果 x 和 "都 是 符号 串 ， 那 么 它们 的 连接 长 度 就 是 它们 各 自 的 长 度 的 和 ， 即 : 

luv| = lu| + vl (1-6) 


尽管 这 个 关系 是 显然 的 ， 但 是 如 果 能 够 使 它 更 精确 并 证 明 就 更 有 帮助 了 。 这 样 做 的 方法 对 于 
处 理 更 加 复杂 的 情况 是 重要 的 。 
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例 1.8 证明 对 于 任何 w 和 v， 式 (1-6) 都 成 立 。 为 了 证 明 这 一 点 ， 我 们 首先 需要 一 个 符号 
串 长 度 的 定义 。 我 们 使 用 递归 的 方式 定义 如 下 : 对 于 所 有 caEz ，w 是 2 上 的 任意 符号 吕 ， 都 有 
lal=1 
lwal=lwl+l 
这 个 定义 是 我 们 根据 直观 理解 符号 串 长 度 而 得 出 的 一 个 形式 化 的 命题 。 单 个 符号 的 长 度 是 1。 
符号 串 增 加 一 个 符号 ， 符 号 串 的 长 度 也 相应 地 增加 1。 使 用 这 个 形式 化 的 定义 ， 我 们 就 可 以 使 
用 归纳 推理 的 方法 证 明 式 (1-6 )。 
根据 定义 ， 对 于 所 有 任意 长 度 的 符号 串 u 和 所 有 长 度 为 1 的 符号 串 v, 式 (1-6) 都 成 立 ， 
这 样 我 们 就 有 了 归纳 基础 。 作 为 归纳 假设 ， 我 们 认为 对 于 所 有 任意 长 度 的 符号 串 x 和 所 有 长 度 
为 1, 2,…, nm 的 符号 种"， 式 (1-6) 都 成 立 。 那 么 ， 我 们 考虑 长 度 为 n + 1 的 符号 串 v>， 并 且 把 它 
写成 v = wa。 则 内 
pl= wl+1 
lv| = luwal = lw + 1 
但 是 根据 归纳 假设 (因为 w 的 长 度 为 x:， 所 以 可 以 使 用 这 个 归纳 假设 的 结论 ) 
jxw| = 四 + wl 
因此 ， 
lavl= al + wl + 1= lal+ {yl 


所 以 ,根据 上 面 的 推导 步骤 和 证 明 、 我 们 证 明了 对 于 所 有 符号 电 4， 和 所 有 长 度 达 到 n + 1 的 符 


号 串 "， 式 (1-6) 都 成 立 。 口 
如 果 w 是 符号 串 ， 那 么 w" 表 示 重 复 w 这 个 符号 串 z 次 。 我 们 定义 
对 于 所 有 的 w 都 有 
w = 人 


如 果 工 是 字母 表 ， 那 么 "表示 连接 Z 中 的 零 个 或 多 个 符号 获得 的 所 有 符号 串 的 集合 。 集 合 

2 总 是 包含 人 。 为 了 把 空 串 排除 在 外 ， 我 们 定义 

| :=5"— {A} 
尽管 根据 假设 知道 是 有 限 的 ， 但 是 因为 >* 和 + 包含 的 符号 申 的 长 度 是 没有 限制 的 ， 所 以 他 
们 两 个 集合 总 是 无 限 的 。 

一 种 语言 通常 定义 为 2 "上 的 子 集 。 一 种 语言 Z 中 的 一 个 符号 串 称 作 这 个 语言 Z 的 一 个 揣 子 
(sentence)。 这 个 定义 非常 宽泛 ， 字 母 表 Z 上 的 符号 串 的 任意 集合 都 可 以 看 成 是 一 种 语言 。 后 
面 我 们 会 学 到 某 些 特殊 语言 定义 和 描绘 的 方法 ， 这 样 就 能 给 出 这 些 语 言 的 结构 ， 而 不 仅仅 是 
宽泛 的 定义 。 不 过 ， 我 们 还 是 先 看 几 个 特殊 的 例子 。 

例 1.9 设 7 = {a, 5b}， 那 么 

2 = {4,a,b,aa,ab, ba, bb,aaa,aab, } 
集合 {a, aa, aab} 是 > 上 的 一 种 语言 。 因为 它 有 有 限 个 句子 ,所 以 我 们 称 之 为 有 限 语言 。 集 合 
L= {a"b’:n20} 
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也 是 > 上 的 一 种 语言 。 符 号 串 aabb 和 aaaabbbb 属 于 语言 L， 而 符号 串 abb 不 属于 语言 L。 这 种 语 
言 是 无 限 的。 我 们 已 知 的 大 多 数 语 言 都 是 无 限 的 。 口 

因为 语言 也 是 集合 ， 所 以 也 可 以 类 似 地 定义 两 种 语言 的 并 、 交 和 差 。 在 全 集 2* 上 定义 语 
言 L 的 补 集 为 

L=2-L 
一 种 语言 的 逆 ， 指 的 是 所 有 的 符号 串 的 逆 的 集合 ， 即 
L* = {wr : wEL} 
两 种 语言 L, 和 /的 连接 指 的 是 ,中 的 任意 元 素 和 中 的 任意 元 素 通过 连接 形成 的 所 有 符号 串 的 
集合 。 具 体 表示 为 
Lib = {xy : xEL,, yEL,} 

我 们 定义 上 "为 L 自 身 连接 n 次 ， 特 殊 地 ， 对 于 任意 语言 L， 都 有 


L° = {4} 
和 
Li=L 
最 后 ， 我 们 定义 一 种 语言 的 星 闭 包 (star-closure) 为 
及 = LULIUL2... 
和 正 闭 包 (positive closure) 为 
L* = LIUL... 
例 1.10 如 果 
L= {a'b":n>0} 
那么 有 


LD = {a’b"a"b” :n>0,m>0} 
注意 上 面 的 x 和 m 没 有 关系 ， 符 号 串 aabbaaabbb 属 于 L?。 
Z 的 逆 使 用 集合 的 方式 描述 很 容易 ， 
L*= {ba :n>0} 
但 是 以 这 种 方式 描述 工 或 * 比 较 困 难 。 尝 试 几 次 ， 你 就 会 发 现 集合 表示 对 于 - 些 复杂 的 语 
言 比较 受 限 。 口 
1.2.2 文法 


为 了 精确 地 研究 语言 ， 我 们 需要 一 种 机 制 来 描述 它们 。 平 常 的 语言 是 不 准确 的 、 含 糊 的 ， 
因此 ， 英 语 的 非 形 式 化 描述 经 常 是 不 够 的 。 在 例 1.9 和 例 1.10 中 使 用 的 集合 表示 更 合适 ， 但 是 
这 种 表示 还 是 有 局 限 性 的 。 接 下 来 我 们 将 学 习 几 种 应 用 在 不 同 的 环境 中 的 语言 定义 机 制 。 首 
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先 ， 我们 介绍 一 种 最 常见 、 最 有 用 的 表示 ， 文 法 (grammar )。 
英语 的 文法 告诉 我 们 一 个 特殊 的 旬 子 是 否 是 一 种 好 的 句 式 。 英 语文 法 的 一 个 典型 规则 是 
“句子 由 名 词 短语 和 谓语 构成 "。 我 们 把 它 写 成 一 种 更 简明 的 形式 ， 是 
< 句子 > 一 < 名 词 短 语 >< 谓 词 > 
上 式 带 有 清楚 的 解释 。 这 种 形式 对 于 处 理 实际 的 句子 当然 是 不 够 的 。 我 们 必须 对 新 引进 的 构 
成 成 分 < 名 词 短语 > 和 < 谓词 > 给 出 如 下 定义 
< 名 词 短语 > 一 < 冠 词 >< 名 词 > 
< 谓词 > 一 < 动词 > 
我 们 把 上 述 结 构 与 实际 的 单词 相 联系 ， 就 是 “a” 和 “the” 是 < 冠 词 >,“boy” 和 “dog” 是 
< 名 词 >,“runs” 和 “wailks” 是 < 动词 >。 这 样 根据 文法 我 们 就 得 到 正确 形式 的 句子 “a boy 
runs” 和 “the dog walks" 。 如 果 我 们 要 在 理论 上 给 出 一 个 完整 的 文法 ， 那 么 每 个 正确 的 句子 
就 都 能 够 按照 这 种 方式 解释 了 。 
这 个 例子 使 用 简单 的 句子 解释 了 个 通用 的 概念 定义 。 我 们 这 里 从 顶层 概念 开始 ， 逐 步 
简化 到 语言 的 不 可 再 化 简 的 部 分 。 这 些 概念 的 概括 帮助 我 们 导出 文法 的 形式 化 概念 。 
定义 1.1 文法 G 是 一 个 四 元 组 
G=(V,T,5,P) 


其 中 ，V 是 对 象 的 有 限 集合 ， 称 为 变量 (variable)， 

7 是 对 象 的 有 限 集合 ， 称 为 终结 符 (terminal symbol)， 

SEV 是 一 个 特殊 符号 ， 称 为 开始 符 (start variable ) ， 

P 是 产生 式 (production) 的 有 限 集 合 。 
如 果 不 特 殊 指出 ， 集 合 V 和 T 是 不 相交 且 非 空 的 集合 。 

产生 式 规 则 是 文法 的 核心 。 它们 指出 文法 如 何 把 一 个 符号 串 转化 成 另 一 个 符号 串 。 通过 

这 个 过 程 ， 产 生 式 规 则 定义 了 一 个 和 这 个 文法 相关 的 语言 。 在 我 们 的 讨论 中 ， 我 们 假设 所 有 
的 产生 式 规 则 都 是 按照 下 面 的 形式 表示 的 


X 一 > 了 
这 里 ，x 是 (VU7)'* 中 的 元 素 ，y 属 于 (VYUT)*。 这 些 产 生 式 可 以 按照 下 面 的 各 种 方式 来 应 用 : 如 
果 一 个 符号 种 w 可 以 写成 

w= uxv 
我 们 就 说 产生 式 * 一 ?可 以 应 用 到 这 个 符号 种 中 。 我 们 可 以 用 ?替换 *， 由 此 获得 一 个 新 的 符 
号 串 

Z = Uyv 
上 述 过 程 可 以 写成 

WwW=>Z 


这 时 我 们 称 w 推 时 (derive) 出 z， 或 者 说 z 由 w 推 导出 。 应 用 文法 的 产生 式 我 们 可 以 以 任意 顺序 
推导 出 连续 的 符号 串 。 只 要 可 以 ， 我 们 就 可 以 使 用 产生 式 ， 按 照 我 们 的 意愿 应 用 产生 式 。 如 果 
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We 
我 们 就 说 w 推 导出 w,， 并 写成 
mW， 
* 表 示 从 mw 推导 出 w, 经 过 没有 指定 的 数量 的 步骤 (包括 零 步 )。 因 此 
ww 


总 是 正确 的 。 


以 不 同 的 顺序 应 用 产生 式 规则 ， 一 个 给 定 的 文法 可 以 生成 很 多 符号 串 ， 其 中 所 有 仅 由 终 


结 符 构成 的 符号 串 的 集合 就 是 这 个 文法 定义 或 生成 的 语言 。 
定义 1.2 设 G =(V,7T,5,P) 是 一 个 文法 ， 那 么 集合 
L(G) = {wET : SS>w)} 
就 是 文法 G 生 成 的 语言 。 
如 果 wEL(G)， 那 么 序列 


S—wWi=wW Ww 


就 是 句子 w 的 一 个 推导 (derivation)。 包 含 变量 和 终结 符 的 符号 捉 S, wi, w,,…， 


的 向 型 (sentential form ) 。 


例 1.11 已 知 文法 
CC=((S} {a,b},S, P) 
其 中 ，P 定 义 为 
一 GD 
4 一 人 
因此 有 
S=—>aSb=—>aaSbb=>aabb 
所 以 ， 我 们 可 以 得 到 
Saabb 


符号 串 aabb 是 G 生 成 的 语言 的 一 个 句子 ， 而 aaSbb 是 一 个 句 型 。 


w,， 称 作 推 导 


文法 G 可 以 完全 定义 语言 L(G)， 但 是 从 文法 上 却 不 容易 获得 对 语言 的 清楚 描述 。 然 而 ， 这 


里 的 这 个 答案 是 相当 明显 的 。 不 难 推测 
L(G) = {a’b’ :n>0} 


证 明 这 个 结论 很 容易 。 如 果 我 们 注意 到 规则 5->aSb 是 递归 的 ， 那 么 就 可 以 使 用 归纳 证 明 的 方 


法 来 证 明 它 。 我 们 首先 指出 所 有 的 句 型 都 有 下 面 的 形式 


wi= a'Sb’ 


(1-7) 


假设 对 于 所 有 长 度 小 于 或 等 于 2i + 1 的 句 型 w， 式 (17) 都 成 立 。 那 么 ， 为 了 获得 另 一 个 句 型 


(不 是 句子 )， 我 们 就 只 能 应 用 产生 式 S 一 aSb。 这 样 我 们 就 得 到 
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a'iSb'i—>a'i+ 1!Sbi+! 
于 是 长 度 为 2i + 3 的 每 个 名 型 也 都 是 式 (1-7) 的 形式 。 因 为 对 于 i = 1, 式 (1-7) 显然 是 成 立 
的 ， 所 以 根据 归纳 对 于 所 有 的 i 它 都 成 立 。 最 后 ， 为 了 获得 一 个 句子 ， 我 们 必须 应 用 产生 式 
3 一 和， 此 时 . 
S aSb"=—>a"b" 

代表 了 所 有 可 能 的 推导 。 因 此 ， 文 法 G 只 能 推导 出 a"b" 这 样 形式 的 符号 上 囊 。 

我 们 还 必须 指出 所 有 这 种 形式 的 符号 种 都 能 够 被 这 个 文法 推导 出 。 这 个 是 很 容易 的 。 我 
们 只 要 按 需要 的 次 数 简单 地 应 用 产生 式 8 一 aSb， 最 后 应 用 8 一 1 就 可 以 了 。 口 

例 1.12 寻找 能 够 生成 下 面 语言 的 文法 

L={a'b"t!l:.n>0} 

解决 以 前 例子 的 想法 可 以 扩展 到 这 个 例子 。 我 们 只 需要 生成 一 个 特殊 的 b。 这 个 可 以 通过 产生 
式 S 一 4b 和 其 他 几 个 产生 式 来 完成 ， 其 他 的 产生 式 选择 的 是 使 用 4 推导 出 前 一 个 例子 生成 语言 
时 使 用 的 产生 式 。 按 照 这 种 方式 推理 ， 通 过 下 面 的 产生 式 ， 我 们 可 以 获得 文法 G = ({5, 4A}, {a， 
b}, S,P) : 





S—Ab 
A~>aAb 
4 一 人 人 


我 们 可 以 使 用 这 些 产生 式 推导 出 一 些 特殊 的 句子 从 而 更 加 确认 结果 的 正确 性 。 口 
上 述 例子 都 相当 简单 ， 因 此 太 严格 的 证 明 反而 显得 多 余 。 但 是 为 一 种 以 非 形式 化 的 方式 
描述 的 语言 寻找 相应 的 文法 ， 或 是 为 某 个 文法 描述 的 语言 指出 直观 的 特点 ， 通 常 都 不 是 容易 
的 。 为 了 证 明 某 个 语言 是 由 文法 G 生 成 的 ， 我 们 必须 要 证 明 (a) 每 个 weEL 都 可 以 使 用 G 中 的 
产生 式 由 5 推导 出 ，(b) 每 个 这 样 推 导出 的 符号 串 都 是 语言 Z 中 的 句子。 . 
例 1.13 已 知 2 = {a,5}， 并 且 ns(w) 和 ns(w) 分 别 表 示 符 号 串 w 中 a 和 5 的 个 数 。 文 法 G 的 产 
生 式 是 
9 一 SS 
S— 入 
S—aSb 
S—bSa 


了 = {w:n(w)= n,(w)} 


这 个 证 明 不 是 很 明显 ， 我 们 需要 详细 地 写 出 证 明 的 过 程 。 

首先 ， 因 为 生成 a 的 产生 式 即 5 一 aSb 和 5 一 bSa， 同 时 生成 。 所 以 ，G 中 的 每 个 句 型 都 有 
相同 数目 的 a 和 b。 因 此 ，L(G) 中 的 每 个 元 素 都 属于 语言 L。 但 是 L 中 的 每 个 符号 申 都 可 以 由 G 
推导 出 ， 这 个 命题 的 正确 性 就 很 难 一 眼看 出 。 

看 看 上 面 的 问题 ， 我 们 考虑 一 下 wEL 可 能 存在 的 各 种 形式 。 假 设 w 是 以 a 开头 ，b 结 束 。 那 
么 它 的 形式 就 是 


w=awib 
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其 中 ，w! 也 属于 居 。 如 果 $ 确 实 可 以 推导 出 上 中 的 任意 符号 串 ， 那 么 我 们 可 以 认为 上 面 的 形式 可 
以 由 | 
S=aSb 

开始 推导 出 。 如 果 以 5 开头，a 结 束 ， 那 么 可 以 类 似 地 证 明 。 因 为 L 中 符号 串 的 开头 符号 和 结束 
符号 可 以 相同 ， 所 以 这 种 证 明 并 不 能 覆盖 所 有 的 情况 。 如 果 我 们 写 出 一 个 这 样 的 符号 串 ， 比 
方 说 aabpbae， 那 么 我 们 可 以 把 它 看 成 是 两 个 更 短 符号 串 aapb 和 ba 的 连接 ， 其 中 这 两 个 符号 串 
都 属于 过。 这 个 对 于 一 般 情 况 是 否 也 是 正确 的 呢 ? 为 了 证 明 它 是 正确 的 ， 我 们 可 以 像 下 面 这 样 
证 明 : 假设 从 符号 串 的 左 端 开始 ， 当 过 到 一 个 a 时 我 们 加 1， 当 遇 到 一 个 b 时 我 们 减 1。 如 果 符 
号 申 开 始 和 结束 都 是 a， 那 么 在 最 左边 的 符号 之 后 的 符号 串 的 计算 得 到 的 值 应 访 是 1， 在 最 右 
边 的 符号 之 前 的 符号 串 的 值 应 该 是 - 1。 因 此 ， 在 符号 串 中 间 的 某 个 位 置 上 ， 计 算 的 值 会 为 0。 
这 就 暗示 这 个 符号 串 一 定 可 以 写成 这 样 的 形式 


Ww = wiw, 


其 中 ，w,，w 都 属于 L。 这 种 情况 我 们 可 以 使 用 产生 式 5 一 55。 
既然 我 们 已 经 直观 上 知道 如 何 证 明了 ， 下 面 我 们 准备 进行 严格 的 证 明 。 我 们 再 次 使 用 归 
纳 证 明 。 假 设 对 于 所 有 满足 wEL， 并 且 |w| < 2n 都 可 以 由 G 推 导出 。 证 明 对 于 所 有 长 度 为 2n + 2 
的 结论 也 成 立 。 如 果 w = aw,b， 那 么 w, 属 于， 并 且 |w,|=2n。 因 此 ， 根 据 假设 有 
Sw 
于 是 ， 可 能 有 
S=—asb Sawib = w 

所 以 w 可 以 由 G 推 导出 。 显 然 ， 如 果 w = bwia， 那 么 可 以 类 似 地 证 明 。 

” 如 果 w 不 是 这 种 形式 ， 即 : 如 果 它 开始 和 结束 的 符号 相同 ， 那 么 根据 上 面 计算 值 的 方法 可 
以 得 出 ， 它 可 以 写成 w = wiw; 的 形式 。 其 中 ，w, w; 都 属于 L， 并 且 长 度 都 小 于 或 等 于 24。 因 
此 ， 我 们 可 以 得 到 


SSS wiS wiw, = w 


上 面 的 归纳 假设 对 于 n = 1 显然 也 成 立 ， 这 样 我 们 就 有 了 归纳 基础 。 最 终 证 明了 对 于 所 有 
的 ”， 命 题 都 是 正确 的 。 加 
通常 ， 一 个 语言 可 以 由 多 个 文法 生成 。 尽 管 这 些 文法 是 有 区 别 的 ， 但 是 它们 在 某 种 程度 
上 是 等 价 的 。 如 果 两 个 文法 G, 和 G, 产 生 相同 的 语言 ， 即 
L(G = L(G,;) 


我 们 就 说 这 两 种 文法 是 等 价 的 (equivalent ) 。 
我 们 后 面 会 谈 到 ， 两 种 文法 的 等 价 性 并 不 容易 看 出 。 
例 1.14 已 知 文法 G1 = ({4， S}, {a, b}, $, P,), 产生 式 己 包括 
S—aAb|A 
A—aAblA 


这 里 我 们 引入 了 一 种 方便 的 速记 表示 。 如 果 几 个 产生 式 有 相同 的 左 部 ， 那 么 它们 的 右 部 可 以 
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写 在 同一 个 产生 式 的 右边 ， 中 间 用 | 隔 开 。 上 面 表示 中 ， 产 生 式 5S 一 ahb|4 表 示 产 生 式 S$ 一 a4b 和 
S—>A。 
上 面 这 个 文法 等 价 于 例 1.11 的 文法 G。 只 要 证 明 
LG) = {anb : n>0} 
成 立 ， 那 么 它们 的 等 价 性 就 容易 证 明了 。 我 们 把 这 个 证 明 过 程 留 作 习 题 。 口 


1.2.3 自动 机 


自动 机 是 数字 计算 机 的 抽象 模型 。 正 因为 如 此 ， 每 个 自动 机 都 包含 一 些 本 质 的 特征 。 它 
们 都 有 读 人 装置 。 一 般 都 假设 输入 是 给 定 字 母 表 上 的 一 个 符号 串 ， 将 符号 串 写 在 输入 文件 
(input file) 上 。 自 动机 只 能 读 入 输入 文件 ， 但 不 能 够 修改 。 输 入 文件 可 以 分 成 若干 个 单元 ， 
每 个 单元 存放 一 个 符号 。 输 入 装置 从 左 到 右 读 入 输入 文件 ， 一 次 读 入 一 个 符号 。 输 入 装置 能 
够 识别 输入 串 的 尾部 〈 通 过 读 出 文件 结束 条 件 来 识别 )。 自 动机 能 够 生成 某 种 形式 的 输出 。 自 
动机 有 一 个 临时 存储 (storage) 设备 。 这 个 临时 存储 设备 包含 无 限 个 单元 ， 每 个 单元 存放 着 
字母 表 上 的 一 个 符号 (不 一 定 是 输入 字母 表 上 的 符号 )。 自 动机 可 以 读 入 存储 单元 中 的 内 容 ， 
并 修改 。 另 外 ， 自 动机 还 有 控制 部 件 (control unit)。 这 个 控制 部 件 可 以 处 于 有 限 个 内 部 状态 
(internal state) 中 的 任何 一 个 上 ， 并 且 按 照 某 个 指定 的 方式 改变 状态 。 图 1-3 给 出 了 一 个 通用 
自动 机 的 示意 图 。 

输入 文件 


-TD 


控制 部 件 存储 











广 








TU- 一 
输出 





图 1-3 


根据 假定 ， 自 动机 是 在 离散 时 间 框 架 上 操作 的 。 在 任意 给 定 的 时 间 点 上 ， 控 制 部 件 处 于 
某 个 内 部 状态 上 ， 输 入 装置 正在 搜索 输入 文件 上 的 一 个 特定 符号 。 下 一 时 刻 控 制 部 件 会 出 现 
在 哪 一 个 内 部 状态 上 由 下 一 个 状态 (nextstate) 或 转移 函数 (transition function) 决定 。 转 移 
销 数 根据 当前 状态 、 当 前 读 入 符号 和 临时 存储 空间 中 的 当前 信息 ， 来 决定 下 一 个 状态 。 从 一 
个 时 间 间 隔 向 下 一 个 时 间 间 隔 转移 的 过 程 中 ， 自 动机 会 产生 输出 ， 或 改变 临时 存储 空间 中 的 
信息 。 格 局 (configuration) 这 个 术语 指 的 是 控制 部 件 、 输 入 文件 和 临时 存储 空间 的 菜 一 特定 
状态 。 自 动机 从 -- 个 格局 到 另 一 个 格局 的 转换 称 为 一 个 迁移 (move )。 

这 个 通用 模型 覆盖 了 我 们 在 这 本 书 讨论 到 的 所 有 自动 机 。 有 穷 状 态 控制 对 于 -一些 特殊 类 
型 的 自动 机 来 说 是 通用 的 ， 但 是 它们 在 输出 的 方式 和 临时 存储 的 本 质 上 是 不 同 的 。 临 时 存储 
的 本 质 对 于 特殊 类 型 的 自动 机 有 着 强大 的 效果 。 
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为 了 后 续 讨 论 的 方便 ， 我 们 必须 区 分 确定 型 自动 机 (deterministic automata) 和 非 确 定型 
自动 机 (nondeterministic automata)。 确 定型 自动 机 指 的 是 根据 当前 的 格局 ， 自 动机 的 每 一 步 
迁移 都 是 唯一 确定 的 。 如 果 我 们 知道 内 部 状态 、 输 入 和 临时 存储 空间 的 内 容 ， 我 们 就 可 以 准 
确 地 预测 自动 机 的 下 一 步行 为 。 在 非 确定 型 自动 机 中 ， 就 不 是 这 样 的 。 在 每 一 点 上 ， 非 确定 
型 自动 机 都 有 几 个 可 能 的 迁移 ， 因 此 ， 我 们 只 能 得 到 一 个 可 能 行为 的 预测 集合 。 各 种 类 型 的 
确定 型 自动 机 和 非 确定 型 自动 机 间 的 关系 在 我 们 的 研究 中 扮演 着 很 重要 的 角色 。 

如 果 一 个 自动 机 的 输出 响应 仅仅 限定 在 简单 的 “yes” 和 “no” 之 间 的 话 ， 这 个 自动 机 就 
是 接受 器 (accepter)。 提 供 一 个 输入 串 ， 接 受 器 要 么 接受 它 ， 要 么 拒绝 它 。 一 个 更 通用 的 自 
动机 ， 能 够 输出 和 输入 相同 的 符号 ， 这 种 自动 机 叫 转换 器 (transducer)。 尽 管 我 们 在 这 本 书 
的 主要 关注 点 是 接受 器 ， 不 过 我 们 在 下 一 节 还 是 给 出 了 一 些 简单 的 转换 器 例子 。 


习题 


. 对 7 进行 归纳 ， 证 明 : 对 于 所 有 的 符号 串 u 和 所 有 的 xn， 都 有 |w"| = nlu|。 
.上 面 已 经 非 形式 化 地 介绍 了 一 个 符号 串 的 逆 ， 它 可 以 使 用 递归 的 方法 更 准确 地 定义 为 : 
对 于 任意 cEz ，wE3*， 都 有 


DD 王 


a*=a 
(wa)* = aw® 

(uv)* = vu* 者 
. 证明 : 对 于 所 有 的 wEY ， 都 有 (w*)* = w。 
. 设 L = {ab, aa, baa}。 下 面 哪 些 符号 串 属于 语言 L*? 

abaabaaabaa, aaaabaaaa, baaaaabaaaab, baaaaabaa 戎 

. 对 于 例 1.12 和 例 1.13 中 的 语言 ， 等 式 L = L* 是 否 成 立 ? 
.是 否 存 在 语言 满足 (ZL) = (ZL)? 
. 证 明 : 对 于 任意 语言 L, 和 L;， 都 有 


上 


~] OO 


(LL) = DD 


Oo 


.证 明 对 于 任意 语言 都 有 (二 )” = 己 。 

:证明 下 列 命题 成 立 或 不 成 立 。 

(a) 对 于 任意 语言 L 和 L,， 有 (DUDL) =UL. 

(b) 对 于 任意 语言 71， 有 (LA” = (7L*)*。 

10. 给 出 在 > = {a,5} 上 能 够 分 别 满足 下 列 条 件 的 语言 的 文法 : 

(a) 只 有 一 个 的 所 有 符号 串 

(b) 至 少 有 一 个 a 的 所 有 符号 串 

(c) a 的 个 数 不 多 于 3 的 所 有 符号 串 

(d) 至 少 有 3 个 a 的 所 有 符号 串 筠 

针对 每 种 情况 ， 证 明 你 给 出 的 文法 是 能 够 产生 相应 语言 的 文法 。 
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11. 简单 描述 由 下 面 的 产生 式 对 应 的 文法 生成 的 语言 。 物 
S—>aA 
A—bsS 
S 一 人 

12. 下 面 产生 式 对 应 的 文法 可 以 生成 什么 样 的 语言 ? 
S—Aa 
A—>B 
B—Aa 


13. 分 别 为 下 面 的 各 种 语言 ， 构 造 生 成 这 种 语言 的 文法 : 
(a) Li={ab”":n>20,m>n}S 
(b) L,= {a'b” :n>0} 
(c) Za = {ab:n21} 
(d) ZL = {fap" 3 :n>3} 
(e) LiL, 
(f) LiUL, 
(g) Li 
(WL 
dL- 
友 14. 给 出 在 > = {a} 上 构造 产生 下 面 语言 的 文法 : 
(a) L= {w:|w|mod3=0} 
(DL={w:|w|mod3>0}@ 
(OL={w:|w|mod3=|w| mod 2} 
(dD) L={w: wlmod 3> |w| mod 2} 
15. 构造 可 以 生成 下 面 语言 的 文法 
L= {ww : wE{a, b}*} 


并 且 给 出 一 个 完整 的 证 明 。 
16. 使 用 例 1.13 的 表示 ， 构 造 下 面 语言 的 文法 。 假 设 2 = {a, b}。 
(DL={w: nw) = nw +1} 
(bD) L = {w :ns(w)> nw)} 
友 (O) L= {w :now) = 2n,(w)} 
(d) L = {wEf{a, b}” :ns(w) ~ nsw)l= 1} 
17. 假设 2 = {a, 5,c}， 重 复习 题 16 (a) 和 习题 16 (d)。 
18. 完成 例 1.14 的 证 明 ， 证 明 L(G,) 确实 能 生成 给 定 的 语言 。 


19. 下 面 两 个 产生 式 对 应 的 文法 等 价 吗 ? 假设 两 个 文法 都 是 以 $ 为 开始 符 的 。 


S—aSblablA 
和 
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S—aAblab 
A—aAb|A 


20. 证 明文 法 G = ({5}, {a, 5}, 5$, P) 和 例 1.13 中 的 文法 等 价 ， 其 中 ， 产 生 式 是 
S—>SSISSS|aSblbSalA 


广 21. 到 目前 为 止 ， 我 们 给 出 的 例子 都 是 相对 简单 的 文法 ， 每 个 产生 式 的 左 部 只 有 一 个 变量 。 
正如 我 们 看 到 的 ， 这 种 文法 非常 重要 ， 但 是 定义 1.1 允 许 更 一 般 的 形式 。 
已 知 文法 G = ({4, 8, C, D,E,5S}, {a}, 5S, P)， 产 生 式 是 
S—ABaC 
Ba—aaB 
BC—DCIE 
aD—Da 
AD—AB 
aE—Ea 
AE—A 


根据 这 个 文法 推导 出 L(G) 中 3 个 不 同 的 句子 ， 然 后 根据 这 些 句子 ， 对 L(G) 进行 猜测 。 
1.3 一 些 应 用 * 


尽管 我 们 强调 形式 语言 和 自动 机 的 抽象 与 数学 本 质 ， 但 是 ， 这 些 概念 在 计算 机 科学 方面 
仍然 存在 着 广泛 的 应 用 。 事 实 上 ， 它 们 还 是 和 很 多 特殊 领域 相 联系 的 普遍 主题 。 在 这 一 书 中 ， 
我 们 给 出 一 些 简单 的 例子 ， 从 而 让 读者 清楚 我 们 这 里 研究 的 内 容 不 是 许多 抽象 内 容 的 罗列 ， 
而 是 一 些 对 于 我 们 理解 许多 重要 的 现实 问题 很 有 帮助 的 东西 。 
形式 语言 和 文法 广泛 应 用 于 和 程序 语言 相关 的 地 方 。 在 编程 的 大 部 分 过 程 中 ， 我 们 或 多 
或 少 都 需要 直观 地 理解 我 们 写 的 语言 。 偶 尔 ， 当 使 用 不 熟悉 的 特征 时 ， 我 们 需要 去 参考 语言 
的 准确 描述 ， 比 如 大 多 数 程序 文本 中 的 文法 图 。 如 果 我 们 写 一 个 编译 器 ， 或 者 想 要 推荐 一 个 
程序 的 正确 性 ， 几 平 每 一 步 都 需要 知道 语言 的 准确 描述 。 程 序 语言 可 以 用 多 种 方式 来 精确 定 
义 ， 可 是 ， 文 法 却 很 可 能 是 其 中 应 用 最 广 的 一 种 。 
描述 像 Pascal 或 C 这 样 典型 语言 的 文法 很 庞大 。 我 们 以 一 个 较 小 的 语言 为 例 来 介绍 文法 的 
应 用 ， 其 中 较 小 的 语言 是 这 个 大 语言 的 一 个 组 成 部 分 。 
例 1.15 “Pascal 中 所 有 合法 标识 符 构成 的 集合 是 一 种 语言 。 通 俗 地 说 ， 合 法 标识 符 指 的 是 
所 有 以 字母 开头 ， 后 面 可 以 跟 任 意 个 数 的 字母 或 数字 的 符号 串 。 下 面 的 文法 使 得 这 个 非 形式 
化 的 定义 更 加 准确 。 
<id>—<letter> <rest> 
<rest>—<letter> <rest>l<digit> <rest>|A 
<letter>—alb|…|z 
<digit>—0|1|:…|9 


在 这 个 文法 中 ， 变 量 是 <id>、<letter>、<digit> 和 <rest>, a, b, …, z,0, 1,…， 9 是 终结 符 。 
标识 符 e0 的 推导 过 程 是 
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<id>=<letter> <rest> 
=a<rest> 
=—>a<digit><rest> 
—a0<rest> 


=>a0 


程序 设计 语言 通过 文法 的 形式 给 出 的 定义 是 普通 的 ， 且 更 有 用 。 但 是 仍然 有 其 他 一 些 更 
方便 的 定义 。 例 如 ， 我 们 使 用 接受 器 来 描述 语言 一 一 把 接受 到 的 每 一 个 符号 串 都 当成 是 语言 
的 组 成 部 分 。 如 果 以 更 精确 的 方式 来 讨论 这 个 问题 ， 我 们 需要 给 自动 机 一 个 更 形式 化 的 定义 。 
我 们 可 以 很 快 就 完成 这 件 事 。 但 暂时 我 们 还 是 先 给 出 一 个 更 直观 的 定义 。 

自动 机 可 以 表示 成 一 个 图 ， 结 点 表示 内 部 状态 ， 边 表示 转移 。 边 上 的 标记 表示 转移 中 发 
生 了 什么 在 输入 和 输出 方面 )。 例如， 图 1-4 表 示 当 输入 符号 是 a 时 ， 发 生 从 状态 1 到 状态 2 的 
转移 。 头 脑 中 有 了 这 样 一 个 直观 的 图 ， 我 们 看 看 下 面 对 Pascal 标 识 符 的 另 一 种 描述 方式 ，“” 口 


图 1-4 
例 1.16 图 1-5 是 一 个 接受 Pascal 所 有 合法 标识 符 的 自动 机 。 这 里 做 些 必 要 的 解释 。 我 们 假 
设 初始 时 自动 机 位 于 状态 1， 我 们 用 一 个 指向 这 个 状态 的 箭头 〈 没 有 起 始 结 点 ) 表示 。 与 以 往 
相同 ， 按 照 从 左 到 在 的 顺序 读 取 待 检查 的 符号 串 ， 一 次 检查 一 个 。 当 第 一 个 符号 是 字母 时 ， 
自动 机 跳 到 状态 2， 后 面 的 符号 串 就 无 关 紧 要 了 。 状 态 2 因 此 表示 接受 器 的 “yes” 状 态 。 相 反 。， 
如 果 第 一 个 符号 是 数字 ， 自 动机 就 会 跳 转 到 状态 3 ， 表 示 接 受 器 的 “no” 状 态 ， 并 且 永远 停留 
在 这 个 状态 。 在 我 们 的 解决 方案 中 ， 我 们 假设 输入 只 有 字母 和 数字 。 口 





字母 或 数字 


图 1-5 


编译 器 和 其 他 的 翻译 器 ， 广 泛 利 用 我 们 已 经 接触 的 这 几 个 例子 的 想法 ， 把 一 种 语言 的 程 
序 转化 成 另 一 种 语言 的 程序 。 正 如 例 1.15 所 示 ， 程 序 设 计 语 言 可 以 通过 文法 被 精确 地 定义 。 
在 判断 某 段 代码 是 否 能 够 被 一 种 程序 设计 语言 接受 时 ， 文 法 和 自动 机 都 起 到 了 举足轻重 的 作 
用 。 上 面 的 例子 给 出 了 如 何 处 理 这 一 过 程 的 提示 。 后 续 的 例子 也 将 以 此 为 基础 扩展 。 

另 一 个 重要 的 应 用 领域 是 数字 设计 ， 在 这 个 领域 ,转换 器 的 概念 很 流行 。 尽 管 对 于 这 个 
领域 我 们 在 这 里 不 会 深入 探讨 ， 但 是 我 们 还 是 给 出 一 个 简单 例子 。 原 则 上 ， 任 何 数字 计算 机 
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都 可 以 被 看 成 是 自动 机 ， 但 是 这 种 观点 不 一 定 合适 。 假 设 我 们 把 计算 机 的 内 部 寄存 器 和 主 存 
看 成 是 自动 机 的 控制 部 件 ， 那 么 ， 如 果 寄 存 器 和 内 存 共 有 n 位 ， 则 自动 机 总 共有 2" 个 内 部 状态 。 
即使 对 于 一 个 很 小 的 n, 结果 仍然 太 大 而 无 法 处 理 。 但 是 如 果 我 们 关注 的 是 一 个 小 得 多 的 单元 ， 
那么 自动 机 理论 就 会 成 为 一 个 有 用 的 设计 工具 。 

例 1.17 ”二进制 加 法 器 是 通用 计算 机 的 一 个 重要 部 分 。 这 种 加 法 器 把 两 个 表示 数字 的 位 
符号 串 作为 输入 ， 把 它们 的 和 作为 输出 。 简 单 地 说 ， 假设 我 们 仅仅 处 理 正 整 数 的 加 法 ， 我 们 
使 用 


X= aoadla, 


表示 正 整 数 


v(xX) = Sa? 
这 是 一 个 通常 的 二 进 制 表示 的 逆 。 
一 个 串 行 加 法 器 将 两 个 这 样 的 数 x = oa 和》 = bob1…b; 从 左 开 始 ， 逐 位 相 加 。 每 个 位 
加 法 产生 和 的 一 个 数字 和 一 个 向 高 位 的 进位 。 二 进 制 加 法 表 (图 1-6) 总 结 了 这 个 过 程 。 





图 1-6 


图 1-7 是 我 们 学 习 计 算 机 时 首先 看 到 的 一 种 块 图 表 。 从 图 中 可 以 知道 ， 加 法 器 是 一 个 接受 
两 个 位 ， 产 生 和 数位 与 可 能 的 进位 的 盒子 。 它 解释 了 加 法 器 能 完成 什么 样 的 计算 ， 但 是 却 没 
有 解释 它 的 内 部 工作 过 程 。 自 动机 (这 里 是 一 个 转换 器 ) 可 以 使 这 个 过 程 更 加 准确 。 


和 一 一 一 和 数位 d; 
和 一 一 串 行 加 法 器 

进位 

图 17 


转换 器 的 输入 是 位 偶 (ai, b;)， 输 出 是 和 数位 d;。 我 们 再 次 用 边 上 标 有 (a;, b)/d, 的 图 表示 
这 个 自动 机 。 从 一 步 运算 到 下 一 步 运算 的 进位 在 自动 机 中 是 用 两 个 标 有 “carry” 和 “no carry” 
的 内 部 状态 来 表示 的 。 最 初 ， 转 换 器 位 于 “no carry” 状 态 。 除 非 遇 到 位 侦 (1, 1)， 否 则 它 将 
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保持 不 变 。 如 果 遇 到 位 偶 (1, 1)， 自 动机 就 进入 “carry” 状 态 。 当 读 入 下 一 个 位 偶 的 时 候 ， 
计算 时 要 考 虚 进 位 。 图 1-8 给 出 了 申 行 加 法 器 的 完整 描述 图 。 按 照 这 个 图 ， 通 过 几 个 小 例子 ， 
你 就 可 以 确定 这 个 加 法 器 是 正确 的 。 


0 (0, 1)/1 (1, 0)/0 


(0, O)/ (1, 0)/1 (0, 1)/0 (1, 1)/1 





(0, 0MX1 


图 1-8 


正如 这 个 例子 指出 的 ， 在 电路 的 高 层 功能 描述 和 它 的 晶体 管 、 门 电路 和 开关 构成 的 逻辑 
实现 中 ， 自 动机 起 到 了 桥梁 的 作用 。 自 动机 清晰 地 表示 了 决策 逻辑 ， 它 的 形式 化 有 利于 它 进 
行 精确 的 数学 实现 。 由 于 这 个 原因 ， 数 字 设 计 主要 依赖 于 自动 机 理论 的 概念 。 对 这 方面 感 兴 
趣 的 读者 可 以 看 这 方面 的 经 典 文章 ， 如 Kovahi 1978。 口 


习题 


.给 出 C 语 言 中 整数 集合 的 文法 。 午 
设计 一 个 接受 C 语 言 中 整数 的 接受 器 。 
. 设计 一 个 能 生成 C 语 言 中 所 有 实数 的 文法 。 
:假设 某 种 程序 设计 语言 只 允许 标识 符 以 字母 开始 ， 可 以 包含 的 数字 至 少 一 个 、 至 多 三 个 ， 
字母 的 数目 任意 。 给 出 一 个 接受 这 种 标识 符 集合 的 文法 和 接受 器 。 
.给 出 Pascal 语 言 中 var 声 明 的 文法 。 
.在 罗马 数字 系统 中 ， 数 字 是 定义 在 {M, D, C,L;X,V, 站 这 个 字母 表 上 的 符号 串 。 设 计 一 个 只 
接受 形式 正确 的 罗马 数字 的 接受 器 。 出 于 简单 考虑 ,我 们 不 使 用 “化 减 ”规定 中 的 /XX 表示 9， 
而 是 使 用 与 之 等 价 的 VI 来 表示 。 
: 我们 假设 自动 机 工作 在 离散 时 间 域 中 ， 这 点 对 于 我 们 后 续 的 讨论 几乎 没有 影响 。 然 而 ， 在 
数字 设计 中 ， 时 间 因 素 的 假设 就 很 重要 了 。 

为 了 能 够 使 计算 机 的 不 同 部 分 的 信号 同步 到 达 ， 延 迟 电路 是 必需 的 。 单 位 延迟 转换 器 
指 的 是 在 一 个 单位 时 间 后 ， 简 单 地 复制 输入 (可 以 看 成 是 符号 的 连续 流 )。 特 殊 地 ， 如 果 转 
换 器 在 时 间 t 读 入 符号 a， 它 会 在 时 间 :+ 1 复制 并 输出 这 个 符号 。 当 时 间 为 1 = 0 时 ， 转 换 器 什 
么 也 没 输出 。 因 此 ， 转 换 器 把 输入 为 a.a,… ， 变 成 输出 ha1a,…。 

设计 一 个 = {a, 他 上 的 单位 延迟 转换 器 的 工作 图 。 驳 
.一 个 "单位 延迟 转换 器 是 在 na 个 时 间 单 位 后 ， 将 输入 复制 az 次 。 即 : 把 输入 aia… 转 化 成 
Naia…。 这 就 意味 着 在 前 "个 时 间 档 ， 转 换 器 没有 输出 。 
(a) 构造 一 个 > = {a,5b} 上 的 二 单位 延迟 转换 器 。 
(b) 证 明 一 个 ?单位 延迟 转换 器 至 少 有 人 Z? 个 状态 。 


(LA 人 iD 一 


个 


- 


oo 
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9. 一 个 二 进 制 串 的 二 进 制 补 码 表示 的 是 一 个 正 整 数 。 它 首先 对 符号 串 的 每 一 位 取 补 ， 然 后 在 
最 低位 加 1。 设 计 一 个 能 够 把 位 符号 串 转化 成 其 相应 的 二 进 制 补 码 的 转换 器 。 假 设 二 进 制 数 
按照 例 1.17 中 的 方式 表示 ， 最 低位 位 于 符号 串 的 左 侧 。 

10. 设计 一 个 能 把 二 进 制 符号 串 转 化 成 八进制 数 的 转换 器 。 例 如 ， 二 进 制 串 001101110 应 该 产 
生 输出 156。 狠 

11. 已 知 输入 a1a，… 是 一 个 位 符号 串 。 每 三 个 位 为 一 个 子 串 ， 设 计 一 个 转换 器 计算 每 一 个 子 申 
的 奇偶 性 。 明 确 的 定义 为 ~ 

m=NA ,=0 


Ni=(a; 2+a;_1+a)mod 2,i= 3,4,… 


例如 ， 输 入 110111 应 该 产生 输出 000001。 各 
12. 设计 一 个 转换 器 ， 接 受 位 符号 串 aiaxa…， 计 算 该 符号 串 中 所 有 连续 的 3 个 位 形成 的 数值 模 
5。 假 设 输出 为 m1, ma, ma …， 则 
m=m,=0 
m= (4a， +2a 1+a-)modSi=3,4,… 
13. 数字 计算 机 一 般 使 用 某 种 类 型 的 编码 ， 来 表示 位 符号 串 的 所 有 信息 。 例 如 ， 符 号 信息 可 以 
使 用 有 名 的 ASCII 码 系统 来 编码 。 
例如 ， 分 别 已 知 字母 表 {a, pb, c, d} 和 {0, 1}， 从 第 一 个 字母 表 向 第 二 个 字母 表 译 码 ， 规 
则 是 : a 一 00, 5 一 01, c 一 10, d 一 11。 构 造 一 个 建立 在 {0, 1} 上 的 译 码 转 换 器 。 例 如 : 输入 
010011 应 该 产生 输出 bad。 
14. 设 x 和 y 是 两 个 正二 进 制 数 。 设 计 一 个 输出 为 max(x, y) 的 转换 器 。 
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第 2 章 有 穷 自动 机 


我 们 在 第 1 章 简要 地 、 非 正式 地 介绍 了 计算 理论 的 基本 概念 ， 还 特意 对 自动 机 进行 了 讨 
论 。 至 此 ， 我 们 仅仅 概要 地 了 解 了 什么 是 自动 机 ， 以 及 如 何 用 图 来 表示 自动 机 。 现 在 ,我 
们 需要 进一步 提供 它 的 更 精确 的 形式 化 的 定义 ， 以 便 得 出 一 些 严 格 的 结论 。 首 先 介绍 有 穷 
接受 器 。 它 是 我 们 将 在 最 后 一 章 介绍 的 通用 模型 的 一 个 简单 又 特殊 的 例子 。 这 种 类 型 的 自 
动机 的 特点 是 没有 临时 存储 。 因 为 输入 文件 不 可 改写 ， 所 以 有 穷 自 动机 在 计算 过 程 中 所 能 
“ 记 住 ”的 东西 是 相当 有 限 的 。 通 过 把 控制 部 件 放 在 某 一 个 特殊 状态 上 ， 自 动机 可 以 把 有 限 
的 信息 保存 到 这 个 控制 部 件 中 。 但 是 由 于 这 种 特殊 状态 是 有 限 的 ， 有 穷 自 动机 只 能 处 理 这 
种 情况 一 一 每 一 时 刻 可 以 存储 的 信息 都 是 有 严格 限制 的 。 例 1.16 中 的 自动 机 是 一 个 有 穷 接受 
器 的 例子 。 


2.1 确定 型 有 穷 接 受 器 


我 们 首先 详细 研究 的 自动 机 是 操作 确定 的 有 穷 接受 器 。 我 们 先 给 出 确定 型 接受 器 的 准确 
的 形式 化 定义 。 


2.1.1 确定 型 接受 器 和 转换 图 
定义 2.1 确定 型 有 穷 接 受 器 (deterministic finite accepter，dfa) 是 一 个 五 元 组 
M = (0Q,7, 6, go,F) 


其 中 ，Q 是 内 部 状态 (internal state) 的 有 限 集 合 ， 

是 符号 的 有 限 集合 ， 叫 做 输入 字母 表 (input alphabet)， 

6:QxY 一 Q 是 一 个 爹 汕 数 ， 叫 转移 函数 (transition function )， 

doEO@ 是 初 态 (initial state ) ， 

FGO 是 终 态 (final state) 集合 。 

确定 型 有 穷 接 受 器 按照 下 面 的 方式 工作 。 开始 时 假设 接受 器 处 于 初 态 qu， 输入 装置 位 于 输 
和 符号 串 最 左 端的 符号 上 。 自 动机 每 次 迁移 的 时 候 ， 输 入 装置 向 右 迁 移 一 个 位 置 ， 因 此 ， 每 
次 迁移 读 入 一 个 输入 符号 。 当 输入 装置 读 完 符号 串 时 ， 如 果 自 动机 处 于 它 的 一 个 终 态 ， 那 么 
表示 自动 机 接受 了 这 个 符号 串 。 和 否则， 表示 自 动机 拒绝 接受 这 个 符号 种 。 输 入 装置 只 能 从 左 
向 右 迁 移 , 并 且 每 次 只 能 读 入 一 个 符号 。 转移 函 数 6 决 定 自动 机 从 一 个 状态 转移 到 另 一 个 状态 。 
例如 ， 如 果 
6(qo, 4) = gi 


dfa 处 于 状态 9。， 并 且 当 前 的 输入 符号 是 a， 那 么 dfa 会 进入 状态 gq)。 
在 讨论 自动 机 时 ， 我 们 应 该 使 用 一 个 清晰 直观 的 图 来 表示 它 。 为 了 可 视 化 地 表示 有 穷 自 
动机 ， 我 们 使 用 转换 图 (transition graph )。 在 转换 图 中 ， 顶 点 表示 状态 ， 边 表示 转移 。 顶 点 
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上 标 有 状态 的 名 字 ， 边 上 标 有 输入 符号 的 当前 值 。 例 如 ， 如 果 gqo 和 gq 都 是 某 个 确定 型 有 穷 接受 
器 M 的 内 部 状态 ， 那 么 M 对 应 的 图 上 就 应 该 有 标 有 go 和 4g1 的 两 个 顶点 。 标 有 a 的 边 【go, 91) 表 
示 转 移 函 数 6(qo, a) = gj。 有 一 个 没有 起 始 于 任何 顶点 的 箭头 指向 初 态 ， 这 是 初 态 的 特征 。 终 
态 用 双 围 表示。 . 
进一步 地 ， 如 果 M = (Q, ,6, go, FF) 是 一 个 确定 型 有 穷 接受 器 ， 那 么 它 对 应 的 转换 图 Gw 就 
有 |Q| 个 顶点 ， 每 个 顶点 上 标 着 不 同 的 gEQ。 对 应 于 每 个 转移 规则 6(gq;, a) = q;， 在 图 中 都 存在 
着 一 条 标 有 a 的 边 (gq;, 4))。 标 有 go 的 顶点 是 初 态 顶 点 ， 而 标 有 qjEF 的 顶点 是 终 态 顶点 。 把 一 
个 dfa 的 (0Q,, 6, qo, FF) 定义 转化 成 转换 图 表示 很 简单 ， 反 之 亦 然 。 
例 2.1 图 2-1 表 示 dfa 
M = ({qo, 91, q2}, {0, 1}, 6, qo, {41}) 

其 中 ，6 定 义 为 

6(qo, 0) = qo, go, 1) = qi 

6(q1, 0) = qo, 6(q1, 1) = gq, 

6(q,, 0) = q,, 6(g,, 1) = q) 
下 面 看 一 下 这 个 dfa 接 受 符号 串 01 的 过 程 。 自 动机 开始 处 于 状态 go， 首 先 读 入 符号 0。 看 图 中 的 
边 ， 我 们 知道 自动 机 仍然 处 于 状态 go。 然 后 ， 读 人 1， 自 动机 进入 状态 9,。 这 时 ， 我 们 处 于 符 
号 串 结 束 的 位 置 ， 同 时 ， 自 动机 进入 终 态 9。 至此， 符号 串 01 被 接受 。 这 个 dfa 不 接受 符号 串 
00， 因 为 自动 机 连续 读 人 两 个 0 之 后 ， 会 进入 状态 go。 用 类 似 的 推理 ， 我 们 会 看 到 自动 机 接受 
符号 串 101、0111 和 11001 ， 而 不 接受 100 和 1100。 口 


0 
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1 i 
2-1 
如 果 引 入 扩展 的 转移 函数 6” : 0 x 2 一 2， 就 更 方便 了 。4 "的 第 二 个 参数 是 一 个 符号 串 ， 
而 不 是 一 个 单一 符号 。 这 个 函数 的 值 是 自动 机 读 人 这 个 符号 串 后 进入 的 状态 。 例 如 ， 如 果 


igo, a) = gq 
并 且 
6(q1,b) = gz 
那么 
9 (qu ab) = 9 


我 们 可 以 递归 地 给 出 形式 化 的 定义 
对 于 所 有 的 gEQ, wEz ,aeEz， 都 有 
6’(g, A)=4g (2-1) 
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5(q,wa= 5660) 0 (2-2) 
为 了 说 明 为 什么 这 些 式 子 是 正确 的 ， 我 们 把 这 几 个 定义 用 到 上 面 介绍 过 的 儿 个 简单 例子 上 。 
首先 ， 我 们 使 用 式 (2-2) 得 到 : 
(go ab) = 6(6°(go, a), b) (2-3) 
但 是 . 
0 (go a) = 6(6"(go, 4), a) 
= 6(go, q) 
= 9i 
把 这 个 替换 到 式 (2-3) 中 ， 得 到 
6 (go ab) = 6(q1, b) = q, 
上 式 和 我 们 期 望 的 结果 相同 。 


2.1.2 语 寺 和 dfa 对 应 的 语言 


给 出 接受 器 的 准确 定义 后 ， 我 们 下 一 步 将 给 出 和 它 相关 联 的 语言 的 形式 化 定义 。 这 种 关 
联 性 是 显而易见 的 。 这 里 的 语言 指 的 是 被 自动 机 接受 的 所 有 符号 串 的 集合 。 
定义 2.2 dfa M = (QO, ,6, go, F) 接受 的 语言 是 定义 在 上 被 MM 接受 的 所 有 符号 事 的 集合 。 
形式 化 地 表示 为 
L(M) = {wEY.” : 6’(go, w)EF} 
注意 我 们 要 求 6 和 6 是 全 函数 。 因 为 自动 机 的 每 一 步 迁移 都 是 通过 定义 而 唯一 确定 的 ， 所 
以 我 们 称 这 个 自动 机 为 确定 型 的 。dfa 处 理 2 "上 的 所 有 符号 串 ， 并 给 出 是 否 接受 该 符号 串 的 结 
果 。 不 接受 意味 着 停 在 非 终 态 上 ， 即 : 
LM)={w EY :6° (go,w) ¥¢F} 


例 2.2 考虑 图 2-2 中 的 dfa。 





图 2-2 


在 画图 2-2 时 ， 我 们 允许 一 条 边 标 有 两 个 标记 。 这 种 标 有 多 个 标记 的 边 是 两 个 或 两 个 以 上 
转移 的 速记 : 当 输入 符号 和 边 标记 上 的 任意 一 个 符号 匹配 时 ， 转 移 就 发 生 。 

图 2-2 中 的 自动 机 除非 遇 到 b，、 否 则 将 会 一 直 停 留 在 它 的 初 态 9o 上。 如果 这 第 一 个 b 也 是 输 
和信 的 最 后 一 个 符号 ， 那 么 这 个 符号 串 会 被 接受 。 如 果 不 是 最 后 一 个 符号 ， 那 么 自动 机 就 会 进 
入 状态 9:， 并 且 永 远 停 留 在 这 个 状态 中 出 不 来 。 这 个 状态 是 陷阱 状态 (trap state)。 从 图 中 我 
们 可 以 清楚 地 看 出 ， 这 个 自动 机 接受 前 面 是 任意 个 a4， 后 面 跟着 一 个 b 的 所 有 符号 申 。 其 他 类 
型 的 符号 串 都 不 接受 。 在 集合 表示 中 ， 这 个 自动 机 接受 的 语言 表示 为 
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L= {a 史 :1>0} 口 


从 这 些 例子 都 可 以 看 出 ， 使 用 转换 图 表示 有 穷 自 动机 很 方便 。 尽管 (根据 例 2.1 和 例 2.2) 
可 以 按照 转移 函数 及 其 扩展 形式 来 画 转换 图 ， 但 是 至 此 我 们 还 没有 证 明 图 的 结果 确实 是 遵循 
了 这 些 函 数 。 在 我 们 的 讨论 中 ， 我 们 尽 可 能 地 使 用 图 这 种 更 直观 的 表示 方法 。 有 既然 如 此 ， 我 
们 就 必须 保证 我 们 没有 被 这 种 表示 方法 误导 ， 并 且 保 证 图 的 方法 和 使 用 6 的 形式 化 属性 的 方法 
是 同样 有 效 的 。 下 面 的 初步 结论 确保 了 这 一 点 。 

定理 2.1 设 M = (Q, >, 6, qo, FF) 是 确定 型 有 穷 接 受 器 ，Gw 是 和 它 相关 联 的 转换 图 。 那 么 
对 于 任意 di EC 和 wE2 ， 6 (9，， w) = 9j 当 且 仅 当 在 Gu 中 有 一 条 从 gq; 到 qj 标 有 w 的 通道 。 
证 明 : 以 例 2.1 为 例 可 以 看 出 这 个 命题 显然 是 正确 的 。 我 们 可 以 对 w 的 长 度 作 归纳 来 严格 证 明 
这 个 命题 。 假 设 这 个 命题 对 于 所 有 |v| < n 的 符号 串 v 都 成 立 。 对 于 长 度 为 n + 1 的 任意 符号 串 w， 
我 们 都 可 以 把 它 写成 


w= va 


假设 5 (9 v) = gi。 因为 |v| = n， 所 以 在 Gy 中 从 9g, 到 gi 一定 存在 一 条 标 有 v 的 通道 。 但 是 如 果 
6(q, w) = 4q;， 那 么 一 定 有 转移 函数 56(q4, a) = q;， 因 此 构造 Gn 时 会 存在 标 有 a 的 边 (qu 9 )。 所 
以 ， Gn 中 ，9; 和 qj 之 间 有 一 条 标 有 va = w 的 通道 。 因 为 对 于 n = 1 结论 显然 为 真 ， 根 据 归纳 证 明 ， 
我 们 得 出 对 于 任意 wE>+， 都 有 

6 (qi w) = uh (2-4) 


即 在 Cw 中 ， 从 4 到 4% 有 一 条 标 有 w 的 通道 。 

反 过 来 可 以 说 明 ， 如 果 存 在 着 这 样 的 通道 ， 则 有 式 (2-4)， 从 而 完成 了 证 明 。 转 

这 个 定理 的 结论 很 显然 ， 所 以 似乎 根本 就 不 需要 形式 化 的 证 明 。 可 是 我 们 却 提 供 了 证 明 ， 
原因 有 两 点 。 第 一 ， 尽 管 证 明 很 简单 ， 可 是 这 是 一 个 和 自动 机 相关 的 归纳 证 明 的 典型 例子 。 
第 二 ， 这 个 命题 的 结论 会 被 反复 用 到 ， 因 此 声明 并 证 明 它 有 助 于 增强 我 们 使 用 图 的 信心 。 和 
使 用 5 的 属性 相 比 ， 图 使 得 我 们 的 例子 和 证 明 更 加 清晰 。 

尽管 图 能 够 方便 地 表示 自动 机 ， 但 是 其 他 类 型 的 表示 也 仍然 是 有 用 的 。 例 如 ， 我 们 可 以 
使 用 表格 来 表示 函数 5。 图 2-3 中 的 表格 和 图 2-2 是 等 价 的 。 在 图 2-3 中 ， 行 表示 当前 状态 ， 列 表 
示 当 前 输入 符号 。 表 格 的 交叉 处 表示 下 一 个 状态 。 
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从 这 个 例子 我 们 显然 可 以 看 出 ， 一 个 dfa 可 以 很 容易 地 用 计算 机 程序 实现 。 例 如 ， 写 成 一 
个 简单 的 表格 查找 或 一 组 “if” 语 名 序列 来 实现 。 不 同 的 应 用 存在 不 同 的 最 佳 实现 方式 或 表示 
方式 。 转 换 图 对 于 我 们 要 完成 的 各 种 各 样 的 命题 来 说 都 是 一 种 方便 的 表示 形式 ， 所 以 我 们 在 
大 多 数论 述 中 都 会 使 用 它 。 

在 构造 非 形 式 化 定义 的 语言 对 应 的 自动 机 时 ， 我 们 都 使 用 类 似 于 高 级 程序 设计 语言 中 用 
到 的 推理 。 但 是 这 种 dfa 的 编程 是 乏味 的 ， 而 且 有 时 由 于 自动 机 功能 不 够 强大 ， 故 而 在 概念 上 
把 问题 复杂 化 了 。 1 

例 2.3 找到 一 个 确定 型 有 穷 接 受 器 识别 所 有 前 缀 为 ab， 定 义 在 2 = {a,b} 上 的 符号 申 。 

这 里 需要 考虑 的 只 有 符号 串 的 前 两 个 符号 ; 读 和 人 这 两 个 符号 后 ， 符 号 串 的 余下 部 分 就 不 
必 理 会 了 。 因 此 ， 我 们 可 以 设计 一 个 四 个 状态 的 自动 机 来 解决 这 个 问题 。 这 四 个 状态 分 别 是 : 
初 态 、 两 个 识别 ab 并 最 终 进入 终 态 的 状态 ， 和 一 个 非 终 态 的 陷阱 状态 。 如 果 第 一 个 符号 是 a， 
第 二 个 符号 是 bp， 那么 自动 机 就 进入 终 态 。 而 且 ， 不 管 剩 下 的 输入 是 什么 ， 它 都 会 停留 在 这 个 
状态 中 。 另 外 ， 如 果 第 一 个 符号 不 是 a， 或 者 第 二 个 符号 不 是 8， 那么 自动 机 会 进入 非 终 态 的 
陷阱 状态 。 图 2-4 呈 现 了 这 个 简单 的 解决 方案 。 口 








例 2.4 构造 一 个 dfa， 接 受 {0, 1} 上 除 包含 有 001 子 串 以 外 的 所 有 符号 串 。 

为 了 判断 是 否 出 现 了 子 串 001， 我 们 不 仅 需 要 知道 当前 的 输入 符号 ， 而 且 要 记得 刚刚 接受 
了 一 个 还 是 两 个 0。 我 们 让 自动 机 进入 一 个 特殊 状态 ， 一边 跟踪 这 种 情况 ， 一 边 标 记 这 种 情况 。 
就 像 程序 设计 语言 中 的 变量 名 一 样 ， 状 态 名 也 可 以 是 任意 的 ， 可 以 使 用 那些 好 记 的 名 字 。 例 
如 ， 已 经 接受 了 两 个 0 的 状态 就 叫 00。 

如 果 符 号 串 以 001 开 始 ， 那 么 自动 机 会 拒绝 它 。 这 就 意味 着 必定 存在 一 条 从 初 态 到 非 终 态 
的 路 径 标 有 001。 为 了 方便 ， 这 个 非 终 态 记 成 001。 这 个 状态 一 定 是 一 个 陷阱 状态 ， 因 为 一 旦 
进入 这 个 状态 ， 后 面 是 什么 符号 都 无 关 紧 要 了 。 所 有 其 他 状态 都 是 接受 态 。 

这 样 我 们 就 有 了 一 个 解决 方案 的 基本 框架 。 但 是 我 们 还 需要 考虑 子 串 001 出 现在 输入 串 中 
闻 的 这 种 情况 。 我 们 必须 定义 2 和 6， 这 样 无 论 我 们 做 什么 样 的 决定 ， 自 动机 都 会 记得 。 在 这 
种 情况 下 ， 当 读 入 一 个 符号 时 ， 我 们 需要 知道 在 符号 串 中 位 于 它 左 边 的 符号 是 什么 ， 比 如 ， 
之 前 的 两 个 符号 是 不 是 00。 如 果 我 们 用 相关 符号 来 标记 状态 ， 那 么 就 很 容易 知道 转移 函数 是 
什么 样 的 了 。 例 如 ， 
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.6(00, 0) = 00 
因为 只 有 出 现 连续 三 个 0 时 ， 才 会 使 用 这 个 转移 函数 。 我 们 关心 的 仅仅 是 和 当前 符号 最 近 的 那 
两 个 符号 ， 我 们 在 dfa 中 用 状态 00 来 记录 。 图 2-5 是 得 到 的 完整 的 结果 。 从 这 个 例子 中 ， 我 们 明 
白 了 便于 记忆 的 状态 名 对 于 眼 踪 某 些 信息 是 很 有 帮助 的 。 使 用 这 个 自动 机 跟踪 一 些 符号 捉 ， 
比如 100100 和 1010100， 我 们 可 以 知道 这 个 结果 的 确 是 正确 的 。 口 





2.1.3 正则 语言 


每 个 有 穷 自 动机 都 接受 某 种 语言 。 如 果 我 们 考察 所 有 可 能 的 有 穷 自 动机 ， 我 们 就 获得 了 
一 个 和 这 些 自 动机 相关 的 语言 集合 。 我 们 把 这 些 语言 集合 称 作 族 (family )。 能 够 被 确定 型 有 
穷 接 受 器 接受 的 语言 族 是 相当 有 限 的 。 随 着 我 们 研究 的 深入 ， 这 个 语言 族 中 的 语言 的 结构 和 
性 质 将 更 加 清晰 。 现 在 我 们 先 简单 地 给 出 这 个 语言 族 的 名 字 。 

定义 2.3 一 种 语言 L 称 为 正则 (regular) 语言 ， 当 且 仅 当 存 在 某 个 确定 型 有 穷 接 受 器 M 满 足 

L= LM) 
例 2.5 证 明 语 言 
L= {awa : wE{a, b}'} 


是 正则 语言 。 为 了 证 明 这 种 或 其 他 某 种 语言 是 正则 语言 ， 我 们 要 为 这 种 语言 构造 一 个 dfa。 这 
种 语言 的 dfa 构 造 类 似 于 例 2.3, 但 是 比 它 要 更 复杂 些 。 这 个 dfa 需 要 检查 符号 串 是 不 是 由 ao 开始 ， 
以 a 结束 ， 符 号 串 的 中 间 是 什么 无 所 谓 。 这 个 问题 的 复杂 之 处 在 于 没有 一 个 明确 的 方法 可 以 判 
断 符 号 串 的 结尾 符号 。 解 决 这 个 困难 的 方法 是 当 dfa 遇 到 第 二 个 ae 时， 就 进入 了 终 态 。 如 果 符 
号 串 还 没有 结束 ， 并 且 又 发 现 一 个 ， 自 动机 就 从 终 态 中 跳出 。 然 后 继续 按照 这 种 方式 扫描 输 
人 ， 每 碰 到 a 就 进入 终 态 。 图 2-6 显 示 了 这 个 问题 的 完整 结果 。 我 们 仍然 可 以 使 用 几 个 例子 来 
入手 汪 和 全 由 是 让 于 全 各 经 过 一 两 个 测试 ， 显 然 就 可 以 知道 当 且 仅 当 符号 串 开始 符号 

结束 符号 都 是 4 时 ，dfa 才 接受 。 因为 我 们 构造 出 了 接受 这 种 语言 的 自动 机 ， 所 以 我 们 根据 
定义 可 以 各 过 各 请 训 是 四 口 

例 2.6 ” 设 Z 是 例 2.5 中 的 语言 。 证 明 忆 也 是 正则 语言 。 我 们 再 次 使 构造 dfa 的 方法 来 证 明正 
则 语言 。 我 们 首先 写 出 语言 过 中 的 表达 式 形 式 ， 即 


L?= {awl aawaa : wi, wsEf{a, b}'} 


因此 ， 我 们 需要 一 个 自动 机 ， 能 够 识别 由 两 个 形式 完全 一 样 的 符号 捉 (只 是 形式 相同 ， 不 要 
求 值 相同 ) 顺序 连接 成 的 符号 种 。 我 们 可 以 以 图 2-6 为 基础 ， 把 顶点 9 进行 修改 。 这 个 状态 不 
再 是 终 态 ， 我 们 从 这 个 状态 开始 寻找 第 二 个 形式 为 awa 的 子 申 。 为 了 识别 第 二 个 子 串 ， 我 们 复 
制 第 一 部 分 的 状态 (分 别 取 了 新 的 名 字 )， 并 且 以 q; 为 第 二 部 分 的 开始 顶点 。 在 aa 出 现 的 地 方 ， 





Ah9hi1 


我 们 把 整个 符号 串 切 分 成 两 部 分 ， 自 动机 开始 识别 第 二 部 分 。 这 部 分 功能 可 以 通过 函数 59,， 
q) = 9 来 实现 。 图 2-7 给 出 了 完整 结果 。 因 为 这 个 dfa 接 受 忆 ， 所 以 它 是 正则 语言 。 口 


ab 
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图 2-7 


最 后 一 个 例子 证 实 了 我 们 的 猜测 ， 如 果 语 言 L 是 正则 语言 ， 那 么 它 自身 的 连接 57, L3，… 就 
都 是 正则 语言 。 我 们 会 在 后 面 证 明 这 个 结论 的 正确 性 。 


习题 


1. 符号 串 0001，01001， 0000110 中 ， 哪些 可 以 被 图 2-1 中 的 dfa 接 受 ? 
2. 已 知 2 = {a,b}， 分 别 构造 接受 下 面 集合 的 dfa: 
(a) 只 有 一 个 a 的 符号 串 
(b) 至 少 有 一 个 a 的 符号 串 
(c) a 的 个 数 不 多 于 3 的 符号 串 钴 
(d) 至 少 有 一 个 ea 并 且 恰 有 两 个 8 的 符号 串 
(e) 恰 有 2 个 a 并 且 有 多 于 两 个 b 的 符号 串 
. 如果 我 们 修改 图 2-6， 使 得 93 成 为 非 终 态 而 go,， q1, 9; 成 为 终 态 。 证 明 这 样 得 到 的 dfa 接 受 语 


言 L。 


(AD 
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4. 归纳 前 一 个 习题 的 结论 。 特 别 地 ， 证 明 如 果 M = (8@, 5, 6, go, F) 和 让 = (Q, ,6, go, 0 一下) 
是 两 个 确定 型 有 穷 接受 器 ， 那 么 就 有 L(M) = L( 4)。 | 

5. 构造 分 别 接受 下 面 语言 的 dfa: 
(a) 了 = fab5wb2 : wEfa, py 区 
(b) 工 ={wiapbw :mwiEfa, b}', w.Et{a, b}'} 

6. 给 出 下 图 描述 的 自动 机 接受 的 语言 集合 的 描述 。 你 能 够 口头 描述 出 这 种 语言 吗 ? 


一 一 一 一 
OO 本 


7. 在 2 = {a,b} 上 ,分 别 构造 接受 下 面 语言 的 dfa: 
(a) L={w:jwmod 3=0} 涡 
(b) L= {w:|wlmod 5z0} 
(c) L={w:n(w)mod3>1} 
(d) L={w:n(w) mod 3>n(w) mod 3} 区 
(e) L={w: (nw) -nw)) mod 3>0} 
(f) L= {w: (nw)+2n,(w)) mod 3 <2} 

友 8. 一 个 符号 串 上 的 “run” 指 的 是 符号 串 中 包含 由 至 少 两 个 相同 符号 构成 的 子 串 。 比 如 ， 符 
号 串 abbbaab 包 含 一 个 符号 b 的 长 度 为 3 的 “run” 和 一 个 符号 a 的 长 度 为 2 的 “run”。 在 {a， 
5b} 上 ， 分别 构造 下 列 语言 的 dfa。 

(a) L= {w : w 不 包含 长 度 小 于 4 的 “run”} 

(b) 工 = {w :符号 的 每 个 “run” 的 长 度 或 者 是 2 或 者 是 3} 

(c) L= {w : 每 个 符号 串 至 多 包含 两 个 长 度 为 3 的 符号 的 “run”} 
(d) L= {w : 每 个 符号 串 就 包含 两 个 长 度 为 3 的 符号 的 “run”} 

9. 在 {0, 1} 上 ,分别 构造 接受 下 列 语言 的 dfa。 . 

(a) 每 个 00 后 面 都 紧 跟 着 1 的 符号 串 。 例 如 ， 符 号 串 101，0010，0010011001 都 属于 这 种 语 
言 ， 而 0001 和 00100 不 属于 。 移 
(b) 所 有 包含 00， 却 不 包含 000 的 符号 串 。 
(c) 最 左边 的 符号 和 最 右边 的 符号 不 同 的 符号 串 。 
(d) 每 4 个 符号 构成 的 子 串 至 多 有 两 个 0。 例 如 ，001110 和 011001 都 属于 这 种 语言 ， 而 10010 
不 属于 ， 因 为 它 的 一 个 子 串 0010 有 三 个 0。 黎 
(e) 所 有 长 度 不 小 于 5 的 符号 串 ， 从 左边 起 第 4 个 符号 跟 最 右边 的 符号 不 同 。 
(f) 所 有 最 左边 的 两 个 符号 和 最 右边 的 两 个 符号 相同 的 符号 捉 。 
友 10. 在 {0, 1} 上 构造 dfa 完 成 下 面 的 功能 。 把 输入 的 符号 串 看 成 是 二 进 制 数 ， 如 果 这 个 二 进 制 
数 能 够 被 5 整除 ， 那 么 就 接受 这 个 符号 串 。 例 如 ，0101 和 1111， 分 别 表示 整数 5 和 15， 
此 可 以 被 接受 。 : 
11. 证 明 : 语言 L = {vwv : v, wE{a,b} ,中 = 2} 是 正则 语言 。 


— 
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12. 证 明 语 言 = {a” : n> 4} 是 正则 语言 。 
13. 证 明 语言 L = {a : n> 0, n+ 人 是 正则 语言 。 物 
14. 证 明 语 言 L = {o : n=i+ 雍 ,i,k 固定 ， j=0,1,2,…} 是 正则 语言 。 
15. 证 明 C 语 言 中 的 所 有 实数 的 集合 是 正则 语言 。 
16. 证 明 : 如 果 L 是 正则 语言 ， 那 么 L 一 {4} 也 是 正则 语言 。 
17. 使 用 式 (2-1) 和 式 (2-2)， 证 明 对 于 所 有 w, vE3%"， 都 有 
6'(qg, wv) = 6°(6°(qg, w), v) 
18. 假设 L 是 图 2-2 中 自动 机 接受 的 语言 。 构 造 接受 语言 的 dfa。 
19. 假设 L 是 图 2-2 中 自动 机 接受 的 语言 。 构 造 接受 语言 ?一 LL 的 dfa。 
20. 假设 ! 是 例 2.5$ 中 的 语言 ， 证 明 忆 是 正则 语言 。 
21. 设 Cw 是 某 个 确定 型 有 穷 接 受 器 1MW 的 转换 图 ,证 明 下 列 结论 : 
(a) 如 果 L(M) 是 无 穷 的 ,那么 在 Gy 中 一 定 存 在 至 少 一 个 回路 。 在 这 个 回路 中 ， 存 在 从 起 
点 到 回路 中 某 个 顶点 的 路 径 ， 以 及 从 这 个 顶点 到 某 个 终点 的 路 径 。 
(b) 如 果 L(M) 是 有 穷 的 ， 那 么 不 存在 这 样 的 回路 。 才 
22. 我 们 定义 截 短 (truncate ) 运算 为 从 任何 符号 串 的 最 右 端 删除 一 个 符号 。 例 如 truncate 
(aaaba) 是 aaab。 把 这 个 操作 扩展 到 语言 上 的 定义 有 
truncate(L) = {truncate(w) : wEL} 
对 于 接受 任 一 给 定 正则 语言 L 的 dfa， 给 出 如 何 构 造 一 个 接受 truncate(L) 的 dfa。 由 此 过 程 来 
证 明 : 如 果 Z 是 不 包含 4 的 正则 语言 ， 那 么 truncate(Z) 也 是 正则 语言 。 
23. 设 x = Co "A,, y= bob1'*b,, z= Coc’Cn, 都 是 按照 例 1.17 定 义 的 二 进 制 数 。 证 明 下 面 用 
三 元 组 构成 的 符号 串 集合 是 正则 语言 
al a, 
中 
CI Cr 
其 中 ai, pr ci; 使 得 x + y = z。 


24. 某 一 给 定 dfa 接 受 的 语言 是 唯一 的 ， 然 而 接受 同一 种 语言 的 dfa 却 有 很 多 。 构 造 一 个 只 有 6 个 
状态 的 dfa， 使 它 接受 图 2-4 中 dfa 接 受 的 语言 。 午 


2.2 非 确定 型 有 穷 接 受 器 


如 果 我 们 允许 有 穷 接受 器 以 非 确定 的 方式 工作 ， 那 么 有 穷 接 受 器 就 会 变 得 更 加 复杂 。 非 
确定 论 虽 然 强 大 ， 然 而 最 初 看 来 却 是 一 个 不 寻常 的 想法 。 因 为 我 们 通常 认为 计算 机 的 工作 过 
程 是 完全 确定 的 ， 每 一 步 都 没有 选择 的 余地 。 然 而 ， 正 如 我 们 接 下 来 将 要 看 到 的 一 样 ， 非 确 
定论 是 一 个 有 用 的 表示 法 。 


2.2.1 非 确定 型 接受 器 的 定义 


非 确定 论 意味 着 自动 机 器 的 每 一 步 迁移 都 要 选择 。 在 非 确定 型 接受 器 中 ， 每 一 步 的 迁移 
不 是 唯一 的 ， 而 是 一 个 由 所 有 可 能 的 迁移 构成 的 集合 。 我 们 使 用 转移 函数 这 种 形式 化 的 方法 


C0 
bo 


Co 
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来 定义 ， 所 以 转移 函数 的 值 域 是 所 有 可 能 状态 的 集合 。 
定义 2.4 非 确定 型 有 穷 接 受 器 (nondeterministic finite accepter, nfa) 是 一 个 五 元 组 


M = (0Q,>,6, go,F) 
其 中 ，Q, ,qo 和 玉 同 确定 型 有 穷 接 受 器 的 定义 相同 ， 但 6 的 定义 为 
6:0Qx (FU{A)—22 
注意 这 个 定义 和 dfa 的 定义 有 三 个 主要 的 不 同 点 。 在 非 确定 型 接受 器 中 ,6 的 值 域 是 害 集 22。 
因此 ， 这 个 函数 的 函数 值 不 是 CO 中 的 一 个 元 素 ， 而 是 它 的 一 个 子 集 。 这 个 子 集 定义 了 通过 转移 
函数 可 以 得 到 的 所 有 可 能 的 状态 。 例 如 ， 如 果 当 前 状态 是 q,， 读 人 符号 a， 并 且 有 
6(g1, a) = {qo0, 92} 
那么 ，gqo 或 9 都 可 能 是 nfa 的 下 一 个 状态 。 同 样 地 ， 我 们 允许 和 4 作 6 的 第 二 个 参数 。 这 意味 着 nfa 
可 以 不 使 用 任何 输入 符号 就 可 以 发 生 转移 。 尽 管 我 们 假定 输入 机 制 能 够 只 能 向 右 迁 移 ， 但 是 
它 也 可 能 在 某 些 迁移 步骤 上 保持 不 动 。 最 后 ， 在 nfa 中 ， 集 合 6g;, a) 可 以 为 空 。 这 种 情况 表示 
这 种 特殊 情况 的 转移 函数 没 定义 。 
像 dfa 一 样 ， 非 确定 型 接受 器 也 可 以 用 转移 图 表示 。Q 决 定 项 点 。 当 且 仅 当 集 合 6(g,, a) 包含 
4 上 时， 图 中 才 存 在 标 有 a 的 边 (gq,, 9;)。 注 意 既 然 4 可 以 是 空 串 ， 图 中 就 可 以 存在 标记 为 4 的 边 。 
如 果 机 器 读 完 一 个 符号 种， 经 过 一 系列 的 迁移 后 进入 终 态 ， 那 么 我 们 称 这 个 符号 串 可 以 
被 这 个 nfa 接 受 。 只 有 无 论 自动 机 如 何 迁 移 ， 都 无 法 进入 终 态 时 ， 我 们 称 这 个 符号 串 被 拒绝 
(不 被 接受 )。 因 此 ， 非 确定 性 被 看 成 具有 “直觉 的 ”洞察 力 ， 因 为 它 每 次 都 能 选择 最 佳 的 迁 
移 方 案 (假设 nfa 想 接受 每 一 个 符号 串 ) 。 , 
例 2.7 观察 图 2-8 中 的 转移 图 。 这 是 一 个 非 确 定型 接受 器 ， 因 为 有 两 条 从 go 出 发 的 转移 边 
标 有 a。 口 


Cm) 


图 2-8 


例 2.8 ”图 2-9 表 示 的 是 一 个 非 确 定型 自动 机 。 之 所 以 说 它 是 非 确 定 的 ， 不 仅 因 为 从 同一 个 
顶点 出 发 的 几 条 边 都 有 相同 的 标记 ， 而 且 因 为 它 有 入 


转移 。 一 些 转移 函数 ， 比 如 6(q:, 0)， 在 这 个 图 中 没 ol 
有 定义 。 这 个 可 以 看 成 是 向 空 集 定义 的 转移 ， 即 : —(%Y ,Xe) (&) 
6(q2, 0) = 分 。 这 个 自动 机 接受 ，1010 和 101010， 但 

入 


不 接受 110 和 10100。 注 意 10 存 在 两 种 不 同 的 通道 ， 
一 种 到 go。， 另 一 种 到 gq,。 尽 管 g, 不 是 终 态 ,但 是 自动 图 2-9 
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机 仍然 接受 这 个 符号 串 ， 因 为 另外 一 种 通道 可 以 到 终 态 

此 外， 可 以 扩展 转移 函数 的 定义 ， 这 样 的 话 ， 它 的 第 一 个 参数 就 可 以 是 符号 囊 。 我 们 规 
定 扩展 转移 函数 6 为， 如 果 

6°(gi, w) = O; 

那么 自动 机 开始 于 状态 q;, 读 人 w 后 ， 自 动机 可 能 处 于 的 所 有 状态 构成 的 集合 为 @,。 同 式 (2-1) 
和 式 《2-2) 类 似 ， 可 以 对 8 进行 递归 定义 ， 这 里 就 不 特别 强调 了 。 通 过 转移 图 可 以 给 出 一 个 
更 有 价值 的 定义 。 口 

定义 2.5 对 于 nfa， 扩 展 的 转移 函数 定义 为 : 6(q;, w) 包含 g;,， 当 且 仅 当 转 移 图 中 从 顶点 gj 
到 顶点 9 存在 标记 为 W 的 通道 。 这 个 定义 对 于 所 有 qi gEQ 和 wE5 都 成 立 。 

例 2.9 图 2-10 表 示 一 个 afa。 在 这 个 nfa 中 ， 存 在 几 个 1 转移 和 像 5(q, a) 这 样 的 没有 定义 的 
转移 。 > 

假设 我 们 想 要 找到 65’(gq,， a) 和 6 (aq，， 入 )。 从 gq1 到 它 自 
身 有 一 条 标记 为 4， 包含 两 个 2 转移 的 通道 。 使 用 两 次 4 (4 一。 A (0 ) 
边 ， 我 们 就 可 以 发 现 到 qo 和 qs 也 有 包含 A 转移 的 通道 。 
因此 ， 图 2-10 

(qi, a) = {qo0, 91, q2} 

既然 在 q, 和 go 之 间 存 在 4 边 ， 我 们 就 此 可 以 知道 6(g,, 加 包含 go。 同样 ， 因 为 任何 状态 如 果 不 迁 
移 都 可 以 到 达 它 自身 ， 且 不 用 读 入 任何 符号 ， 所 以 6'(q,, 和 ) 也 包含 gq,。 

因此 





6 (9 A) = {go, 9;} 
尽 可 能 地 使 用 4 转移 ， 我 们 就 可 以 得 到 
6'(g,, aa) = {qo, q1, q2} 站 

尽管 通过 带 有 标记 的 通道 来 定义 5 不 太 正式 ， 但 是 这 样 有 助 于 我 们 近 距 离 地 理解 这 个 名 
词 。 定 义 2.5 是 正确 的 ， 因 为 在 任何 两 个 顶点 v; 和 vj 之 间 ， 要 么 存在 一 条 标记 为 w 的 通道 ， 要 么 
不 存在 。 这 说 明 5 是 完全 定义 的 。 我 们 总 是 可 以 使 用 这 个 定义 来 找 人 (q;, w)， 这 一 点 也 许 很 难 
看 出 来 。 

在 1.1 节 中 ， 我 们 给 出 了 一 个 找 出 两 个 顶点 间 所 有 简单 路 径 的 算法 。 但 是 在 这 里 我 们 不 能 
直接 使 用 这 个 算法 ， 因 为 正如 例 2.9 所 示 ， 带 有 标记 的 通道 不 总 是 简单 路 径 。 我 们 可 以 修改 这 
个 简单 路 径 的 算法 ， 坟 纺 不 能 有 重复 的 顶点 和 边 的 限制 这 个 新 的 算法 就 可 以 产生 一 系列 长 
度 为 1, 2, 3,… 的 通道 。 

这 里 仍然 存在 着 困难 。 给 定 w， 一 个 标记 为 w 的 通道 有 多 长 ?答案 不 是 显而易见 的 。 在 例 
2.9 中 ， 顶 点 9 和 9: 之 间 标 记 为 a 的 通道 长 度 为 4。 这 是 由 于 转移 造成 的 ， 因 为 它 ， 通道 的 长 度 
增加 了 ， 可 是 标记 的 符号 没有 变化 。 通 过 观察 可 以 得 出 ， 如 果 两 个 顶点 w 和 v 之 间 存 在 标记 为 
w 的 通道 ， 那 么 它们 之 间 就 一 定 存在 长 度 不 大 于 A + (1 + Ajlw| 标 记 为 w 的 通道 其 中 ，A 是 图 
中 4 边 的 数目 。 证 明 如 下 : 因为 4 边 可 以 重复 ， 所 以 总 存在 这 样 一 条 通道 : 每 一 个 重复 的 4 边 都 
被 一 个 标记 为 非 空 符号 的 边 隔 开 。 否 则 ， 通 道中 包含 标记 为 4 的 回路 ， 这 条 通道 可 以 由 一 个 简 
单 路 径 赫 代 ， 并 且 不 改变 原 通 道上 的 标记 。 这 个 命题 的 详细 证 明 我 们 留 作 习 题 。 
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有 了 上 面 的 基础 ， 我 们 给 出 计算 5(g;, w) 的 方法 。 我 们 考察 所 有 起 点 为 w， 长 度 至 多 是 
A + (1 + A)|w| 的 通道 。 从 中 选 出 标记 为 w 的 通道 。 选 出 的 通道 的 终点 就 是 集合 6(g;, w) 中 的 
元 素 。 

正如 确定 型 接受 器 一 样 ， 我 们 也 可 以 使 用 递归 的 方式 来 定义 85。 不 幸 的 是 ， 结 果 并 不 像 想 
象 中 的 那么 透明 ， 非 确定 型 接受 器 的 扩展 转移 函数 很 难 按照 确定 型 的 方法 来 定义 。 因 此 ， 我 
们 更 倾向 于 使 用 定义 2.5， 因 为 它 更 直观 ， 更 容易 操作 。 

和 dfa-- 样 ， 通 过 扩展 转移 函数 给 出 nfa 接 受 的 语言 的 形式 化 定义 。 

定义 2.6 nfa M = (QO, ,6, qo, F) 接受 的 语言 L 是 按照 上 述 方式 被 接受 的 所 有 符号 事 的 集 
会 。 即 

LM) = {wEY. : (go, WNF + 0} 

总 之 ,语言 包含 的 所 有 符号 囊 w 都 满足 : 在 转移 图 中 ， 从 起 始 项 点 到 某 个 终点 存在 标记 为 W 的 

例 2.10 ”图 2-9 中 自动 机 接受 的 是 什么 语言 ? 从 图 中 不 难看 出 ， 只 有 当 输 入 是 重复 的 符号 
串 10,， 或 者 空 申 时 ，nfa 才 会 停 在 终 态 。 因 此 ， 自 动机 接受 的 语言 是 L = {(10)" : n> 0}。 

当 输 入 是 符号 串 w = 110 时 ， 自 动机 会 怎么 办 呢 ?” 读 入 前 级 11 后 ， 自 动机 进入 状态 q9,， 可 
是 转移 函数 6(q,, 0) 是 没有 定义 的 。 我 们 称 这 种 状况 是 死 格局 (dead configuration)， 并 且 可 以 
把 这 种 情况 简单 地 看 作 是 自动 机 的 没有 进一步 行动 的 停机 。 但 是 我 们 必须 记 住 这 种 状况 是 不 
严密 的 ， 并 且 可 能 带 来 误解 释 的 危险 。 我 们 认为 准确 的 定义 是 

6’(qgo, 110)= 0 

因此 ， 处 理 w = 110， 最 终 不 能 进入 终 态 。 所 以 ， 这 个 符号 串 不 被 接受 。 口 


2.2.2 为 什么 需要 非 确 定型 


在 非 确定 型 机 器 推理 的 过 程 中 ， 我 们 要 谨慎 使 用 直觉 表示 。 直 觉 很 容易 使 我 们 误 入 歧途 ， 
我 们 必须 给 出 准确 的 论断 来 证 实 我 们 的 结论 。 非 确定 型 是 一 个 较 难 的 概念 。 数 字 计 算 机 完全 
是 确定 型 的 ， 在 任何 时 刻 ， 根 据 它 的 输入 和 当前 状态 都 可 以 预测 它 的 下 一 个 状态 ， 并 且 这 个 
状态 是 唯一 的 。 因 此 ， 人 们 很 自然 地 就 会 问 ， 为 什么 我 们 要 研究 非 确定 型 机 器 昵 ? 我 们 试图 
为 现实 系统 建 模 ， 那 么 我 们 为 什么 还 要 考虑 这 些 非 确定 型 的 因素 呢 ? 我 们 通过 以 下 几 种 方式 
来 回答 这 个 问题 。 

许多 确定 型 算法 要 求 在 某 些 阶段 做 出 选择 。 一 个 典型 的 例子 是 决策 程序 。 我 们 通常 并 不 
知道 最 佳 的 策略 ， 但 是 我 们 可 以 使 用 具有 回 漳 功 能 的 穷 举 查找 来 找到 最 佳 策 略 。 当 同时 存在 
儿 种 策略 时 ， 我 们 选择 其 中 的 一 种 走 下 去 ， 直 到 我 们 可 以 判断 这 种 策略 是 否 是 最 佳 的 。 如 果 
不 是 ， 我 们 就 回 退 到 最 后 的 决策 点 ， 探 索 其 他 的 策略 。 非 确定 型 算法 可 以 做 出 最 佳 的 选择 来 
解决 这 个 问题 ， 并 且 不 需要 回调 。 然 而 ， 确 定型 算法 必须 要 增加 一 些 额外 工作 才能 完全 模拟 
非 确定 型 算法 。 因 此 ， 非 确定 型 机 器 可 以 看 作 是 查找 回溯 算法 的 模型 。 

非 确 定型 有 时 可 以 有 助 于 简单 地 解决 问题 。 看 图 2-8 中 的 nfa。 很 明显 ， 开 始 的 时 候 就 需要 
做 出 一 个 选择 。 选 择 上 面 ， 则 符号 串 会 被 接受 。 相 反 ， 选 择 下 面 ， 则 只 能 接受 包含 偶数 个 a 
的 符号 串 。 这 个 nfa 接 受 的 语言 是 {ayU{fen : n> 1}。 当 然 我 们 也 可 以 找到 接受 这 种 语言 的 dfa， 
但 是 非 确定 型 接受 器 看 起 来 更 自然 。 这 种 语言 是 两 个 不 同 集合 的 并 。 非 确定 型 接受 器 就 让 我 
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们 在 这 个 并 集合 上 进行 选择 。 确 定型 的 解 不 像 非 确定 型 这 样 和 定义 有 明显 的 联系 。 接 下 来 ， 
我 们 将 给 出 一 些 证 明 非 确定 型 有 用 的 更 有 说 服 力 的 例子 。 . 
同样 地 ， 非 确定 型 可 以 简明 地 描述 一 些 复杂 语言 。 注 意 包含 非 确定 元 素 的 语法 定义 。 已 知 ， 
S—aSb|A 


我 们 在 任何 时 候 都 面临 着 选择 : 使 用 第 一 个 产生 式 ， 还 是 第 二 个 产生 式 。 使 用 这 两 条 推导 规 
则 ， 我 们 可 以 区 分 很 多 不 同 的 符号 串 。 

最 后 ， 引 入 非 确定 型 还 有 着 技术 方面 的 原因 。 正 如 我 们 看 到 的 ， 有 些 结论 使 用 nfa 更 容易 
得 到 。 我 们 下 一 个 主要 命题 是 指明 这 两 种 自动 机 并 没有 什么 本 质 上 的 区 别 。 因 此， 人 允许 非 确 
定型 常常 可 以 简化 形式 化 证 明 ， 而 且 又 不 影响 结论 的 一 般 化 。 


习题 


1. 详细 证 明 前 一 节 的 命题 : 如果 在 转移 图 中 存在 标记 为 w 的 通道 ， 那 么 一 定 存在 长 度 不 大 于 
A + (1+ A)lw| 标 记 为 w 的 通道 。 
2. 构造 一 个 dfa， 使 得 它 能 接受 图 2-8 中 nfa 接 受 的 语言 。 
3. 在 图 2-9 中 ， 确 定 6(qo, 1011) 和 6 (9 ,01)。 
4. 在 图 2-10 中 ， 确 定 6'(go, a) 和 5 (9 力 。 世 
5. 在 图 2-9 的 nfa 中 ， 确 定 56(go, 1010) 和 6'(g,， 00) 。 
6. 设计 一 个 状态 数 不 超 过 5 的 nfa， 接 受 集合 {abab” : n> 0}Utf{aba” : n>0}。 
7. 构造 一 个 3 个 状态 的 nfa， 接 受 语言 {ab, abc}"。 者 
8. 你 认为 可 以 找到 状态 少 于 3 个 的 nfa 来 解决 习题 7 的 问题 吗 ? 大 
9. (a) 构造 3 个 状态 的 nfa ， 接 受 语言 
了 = {a :PP>1TU{fpnac:m>0O 大 >0} 


(b) 你 认为 存在 状态 数 少 于 3 的 nfa 能 接受 (a) 中 的 语言 吗 ? 
10. 构造 4 个 状态 的 nfa， 接 受 语言 L = {a” : n>20}Ut{b"a :n>1})。 
11. 符号 串 00，01001，10010，000，0000 中 ， 哪 些 可 以 被 下 面 的 nfa 接 受 ? 


1 
0 和 1 
QT 他 
7 7 
0,1 0, 入 
12. 给 出 图 2-10 中 nmfa 接 受 的 语言 的 补 集 。 
13. 设 L 是 图 2-8 中 nfa 接 受 的 语言 。 构 造 接 受 语言 LUt{a5} 的 nfa。 
14. 给 出 习题 12 中 语言 的 简单 描述 。 1 
15. 构造 接受 {a} "的 nfa， 并 且 满 足 : 车 从 它 的 转移 图 中 去 掉 一 条 边 (没有 任何 其 他 变化 )， 则 
得 到 的 自动 机 可 以 接受 {a}。 饮 
16. 习题 15 可 以 用 一 个 dfa 来 解决 吗 ? 如 果 可 以 ， 给 出 这 个 解 。 否 则 ， 证 明 你 的 结论 。 
17. 定义 2.6 修 改 后 如 下 所 示 : 一 个 带 有 多 个 初 态 的 nfa 是 一 个 五 元 组 
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M=(Q,2, 56, Qo,F) 
其 中 ， CQ 是 所 有 可 能 的 初 态 集合 。 这 个 自动 机 接受 的 语言 定义 为 
L(M) = {w : 6'(qo, w) 包含 9/， 对 于 任意 quoEC。， GE 
证 明 : 对 于 任何 一 个 多 初 态 nfa， 总 存在 某 个 单 初 态 nfa 接 受 同 样 的 语言 。 韦 
18. 假设 习题 17 增 加 一 条 限制 条 件 QoNF = 多。 这 个 限制 条 件 会 影响 结论 吗 ? 
19. 使 用 定义 2.5 证 明 : 对 于 所 有 的 9EQ 和 w，vE5*， 都 有 
6'(g,w)= (Jé'(p,») 
GE (q,w) 


20. 满足 下 列 条 件 的 dfa 称 为 不 完全 (incomplete ) dfa。 
(a) 没有 ^ 转 移 ; 
(b) 对 于 所 有 的 EC 和 acE2Z ，6(q, a) 至 多 包含 一 个 元 素 。 
显然 ， 根 据 这 样 的 定义 ， 自 动机 的 迁移 选择 是 唯一 的 。 
已 知 > = {a,5}， 把 不 完全 dfa 转 化 成 一 个 标准 dfa。 区 


s 


2.3 确定 型 有 穷 接 受 器 和 非 确 定型 有 穷 接 受 器 的 等 价 性 


现在 我 们 问 一 个 基本 问题 。dfa 和 nfa 有 哪些 不 同 ? 显然 ， 它 们 的 定义 不 同 ， 但 是 这 并 不 意 
味 着 二 者 之 间 存 在 着 本 质 差 蜡 。 为 了 进一步 探讨 这 个 问题 ， 我 们 引入 自动 机 等 价 的 定义 。 

定义 2.7 对 于 两 个 有 穷 接受 器 Mi 和 1 ， 如 果 

L(M') = L(M,) 

即 : 它们 接受 相同 的 语言 。 那 么 ， 这 两 个 有 穷 接受 器 等 价 。 

正如 以 前 提 到 的 ， 对 于 一 种 给 定 的 语言 ， 搂 受 它 的 接受 器 很 多 ， 因 此 ， 任 何 一 个 dfa 或 nfa 
都 有 多 个 等 价 的 接受 器 。 

例 2.11 图 2-11 中 表示 的 dfa 和 图 2-9 的 nfa 等 价 ， 因 为 它们 都 接受 语言 


{(10)" : n > 0} 口 
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当 我 们 比较 两 类 自动 机 时 ， 我 们 总 会 问 哪 种 自动 机 更 强大 。 更 强大 指 的 是 哪 种 自动 机 可 
以 完成 另外 一 种 自动 机 无 法 实现 的 东西 。 让 我 们 针对 有 穷 接 受 器 考虑 这 个 问题 。 既 然 dfa 在 本 
质 上 是 一 种 更 加 严格 的 nfa， 那 么 显然 ，dfa 接 受 的 任何 语言 nfa 也 应 该 可 以 接受 。 但 是 ， 反 之 
就 不 是 那么 明显 了 。 我 们 既然 增加 了 非 确定 型 这 种 机 制 ， 那 么 起 码 应 该 存在 一 种 nfa 能 接受 的 
语言 ， 我 们 找 不 到 dfa 来 接受 。 但 事实 证 明 不 是 这 样 的 。dfa 和 nfa 这 两 类 是 同样 强大 的 : nfa 能 
接受 的 语言 ，dfa 也 可 以 接受 。 

这 个 结论 不 是 很 明显 ， 因 此 需要 证 明 。 这 个 命题 ,正如 本 书 中 大 多 数 命 题 一 样 ， 要 采取 
构造 性 证 明 的 方法 。 这 就 意味 着 我 们 可 以 给 出 一 种 把 nfa 转 化 成 等 价 的 dfa 的 方法 。 这 个 构造 方 
法 不 难 理解 。 一 旦 原则 清晰 了 ， 那 么 这 就 可 以 成 为 严格 证 明 的 开始 点 。 构 造 证 明 的 基本 原理 
如 下 。nfa 读 入 符号 种 w 后 ， 我 们 并 不 确切 地 知道 自动 机 会 进入 哪 一 个 状态 ， 但 是 我 们 可 以 说 
它 一 定 是 处 于 可 能 的 状态 集合 的 某 一 个 状态 中 ， 记 作 {g,, 9 …, qx}。 而 一 个 等 价 的 dfa 读 入 同 
样 的 符号 串 后 ， 一 定 会 处 于 某 一 个 确定 的 状态 。 那 么 ， 我 们 如 何 把 这 两 种 情况 对 应 起 来 呢 ? 
这 里 有 个 小 窍门 : 把 上 面 的 状态 集合 标记 成 dfa 的 状态 ， 使 得 读 入 符号 串 w 后 ， 等 价 的 dfa 进 入 
一 个 标记 为 {gq;, 9), …, 9 的 状态 中 。 既 然 |CI 个 状态 的 集合 只 有 2i2 个 子 集 ， 那 么 对 应 的 dfa 就 有 
有 穷 个 状态 。 

上 面 介绍 的 构造 性 方法 的 主要 工作 集中 于 nfa 的 分 析 ， 从 而 获得 输入 和 可 能 的 状态 之 间 的 
对 应 关系 。 在 形式 化 地 描述 上 面 的 方法 之 前 ， 我 们 先 使 用 下 面 的 简单 例子 解释 。 

例 2.12 ”把 图 2-12 中 的 nfa 转 化 成 等 价 的 dfa。 这 个 nfa 的 初 态 为 g。， 因 此 dfa 的 初 态 标记 为 
{4o}。 读 入 符号 a 后 ，nfa 处 于 状态 9 中 ， 或 者 经 过 2 转移， 进入 状态 9;。 因 此 ， 对 应 的 dfa 一 定 
存在 一 个 标记 为 {q1, 9?} 的 状态 ， 并 包含 一 个 转移 函数 


do({q0}, 9) = {4q1, 92} 
在 状态 9。， 输 入 为 b 时 ，nfa 没 有 指定 转移 函数 ， 因 此 ， 
{qo}, 5)= 0 
状态 标记 为 8 表 示 nfa 不 可 能 迁移 ， 也 就 是 说 ， 自 动机 不 接受 这 个 符号 串 。 因 此 ， 这 个 状态 应 
该 对 应 于 dfa 的 一 个 非 终 态 的 陷阱 状态 。 


a 





2-12 
现在 我 们 已 经 引入 了 dfa 的 状态 {qi, 9,} ， 因 此 我 们 需要 确定 这 个 状态 的 输出 转移 函数 。 我 
们 已 知 dfa 的 这 个 状态 对 应 于 nfa 中 的 两 个 可 能 状态 ， 因 此 我 们 可 以 回来 看 看 nfa。 如 果 nfa 处 于 
状态 91， 读 入 符号 a， 那 么 它 会 进入 状态 q1。 而 且 ，nfa 可 以 从 状态 gq 做 4 转移 进入 状态 g,。 如 果 
nfa 处 于 状态 4 ， 读 入 同样 的 符号 ， 那 么 就 找 不 到 指定 的 转移 函数 。 因 此 ， 
6({q1, q2}, a) = {91, 9,} 
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类 似 地 ， 
6({q1, q2}, b) = {qo} 


至 此 ， 对 每 个 状态 都 定义 了 所 有 的 转移 函数 。 最 后 的 结果 ， 如 图 2-13 所 示 ， 是 一 个 和 我 
们 开始 提出 的 nfa 等 价 的 dfa。 图 2-12 中 的 nfa 接 受 所 有 满足 条 件 6(go, w) 包含 9 的 符号 种 。 为 了 
使 对 应 的 dfa 接 受 每 一 个 这 样 的 符号 串 w， 任 何 包含 状态 4 的 标记 都 必须 设 为 终 态 。 口 
定理 2.2 设 L 是 被 非 确定 型 有 穷 接受 器 My = (Qw, ,6w, qu， 
AN) 接受 的 语言 。 那 么 ， 一 定 存 在 一 个 确定 型 有 穷 接受 器 Mp = 


(Qp, 5, 6p, {qo}, Fp), 满足 上 (| 
b= -~ , 


证 明 : 给 定 WMv， 我 们 使 用 下 面 的 程序 nfa_to_dfa 来 构造 接受 器 Mn 6 (@) 
的 转移 图 Co。 为 了 便于 理解 构造 函数 , 记 住 Go 必 须 具 有 某 些 性 质 。 
每 个 顶点 必须 有 | 了 | 条 输出 边 ， 并 且 每 条 边 必 须 标 有 不 同 的 Z 元 素 。 
在 构造 的 过 程 中 ， 一 些 边 可 能 会 漏 掉 ， 但 是 我 们 不 断 地 使 用 这 个 2 
程序 从 而 保证 不 漏 掉 任何 边 。 图 2.13 

程序 : nfa_to_dfa 

1. 从 顶点 {go} 开始 构造 图 Gb。 把 这 个 顶点 作为 起 始 顶 点 。 

2. 重复 下 面 的 步骤 ， 直 到 没有 边 被 漏 掉 。 

取 Gp 的 一 个 顶点 {4i, 4j, …, 4 小， 该 顶点 没有 标记 为 cEZ 的 输出 边 。 

计算 6 (9q,， a), 6 (qi， a),…， 6 (qu 0D)。 

然后 ， 根 据 所 有 这 些 5 的 并 集 得 到 集合 {q, q,,…, 9 小。 

如 果 Gp 中 不 存在 标记 为 {91, gw, …, 9,} 的 顶点 ， 那 么 在 Gb 中 添加 一 个 标记 为 {gi, g,,…, g,} 
的 顶点 。 

在 Gp 中 增加 一 条 从 {qi, qj, …, 9 对 到 {g gw …, qs} 的 边 ， 标 记 为 a。 

3. 对 于 Gp 中 的 每 一 个 标记 包含 qfEF 的 状态 ， 都 把 它 作 为 终点 。 

4. 如 果 MM\ 接 受 和 ， 那么 Gb 中 的 顶点 {qo} 也 是 终点 。 

很 明显 ， 这 个 程序 总 会 停止 。 每 次 经 过 步 又 2 的 循环 时 ，Go 都 会 增加 一 条 边 。 但 是 Gy 至 
多 有 24wlz| 条 边 ， 所 以 ， 循 环 总 会 停 下 来 。 为 了 证 明 这 个 构造 的 正确 性 ， 我 们 会 通过 对 输入 
符号 串 的 长 度 进行 归纳 来 证 明 。 

假设 对 于 长 度 不 超过 ”的 所 有 符号 串 v*， 在 Guw 中 存在 从 go 到 9 的 标记 为 "的 通道 ， 这 意味 着 
在 Gb 中 存在 从 {qo} 到 状态 Q; = {…, 9;, …} 的 标记 为 "的 通道 。 现 在 考虑 任何 符号 串 w = ve， 以 
及 在 Gu 中 的 从 go 到 4 的 标记 为 w 的 通道 。 从 qo 到 4g 一 定 存在 标记 为 v 的 通道 ， 而 从 9 到 9 有 标记 为 
a 的 边 (或 一 系列 的 边 )。 根 据 归 纳 假 设 可 知 ， 在 Go 中 一 定 存在 一 条 从 {go} 到 Q, 的 标记 为 v 的 通 
道 。 但 根据 构造 可 知 ， 在 Gp 中 一 定 存 在 从 {qo} 到 某 个 状态 的 边 标记 包含 v。 因 此 ， 对 于 长 度 为 
n + 1 的 所 有 符号 电 归 纳 假设 也 成 立 。 因 为 对 于 n = 1 命题 显然 成 立 ， 所 以 对 于 所 有 的 n 命 题 都 
成 立 。 于 是 得 到 结论 ， 如 果 5%(qo, w) 包含 终 态 qg;/， 那 么 (qo, mw) 也 包含 终 态 。 为 了 证 明 的 完整 
性 ， 我 们 把 命题 倒 过 来 ， 即 证 明 : 如 果 52(go, w) 包含 %， 那 么 6vw(qo, w) 也 包含 g;。 医 

尽管 已 经 证 明了 这 个 命题 的 正确 性 ， 但 是 为 了 简洁 的 需要 ， 我 们 还 是 只 列 出 了 主要 的 步 
又 。 我 们 会 在 这 本 书 剩 下 的 部 分 继续 这 方面 的 练习 。 我 们 只 强调 证 明 过 程 中 的 主要 想法 ， 至 
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于 一 些 细节 ， 读 者 可 以 自己 补 上 。 
上 面 的 构造 证 明 虽然 枯燥 ， 但 却 十 分 重要 。 我 们 再 举 一 个 例子 来 帮助 读者 理解 构造 证 明 


的 所 有 步骤 。 

例 2.13 把 图 2-14 的 nfa 转 化 成 等 价 的 确定 型 自动 机 。 因 为 6vgo, 0) = {qo, 91}， 所 以 我 们 在 
Go 中 引入 状态 {qo, 91}， 在 {qo} 和 {qo, 4 之 间 增 加 一 条 标记 为 0 的 边 。 同 样 地 ， 已 知 Sw(qgo, 1) = 
{91}， 我 们 增加 状态 {9,}， 在 它 和 {qo} 之 间 增 加 标记 为 1 的 边 。 


0 1 


2-14 


现在 还 有 很 多 漏 掉 的 边 ， 因 此 我 们 继续 使 用 定理 2.2 中 的 构造 方法 。 使 4 = 0, i = 0,j = 1， 
我 们 可 以 得 到 





6n(qo, 0)U6w(g 0) = {qo, q1, gq2} 
这 就 形成 了 一 个 新 的 状态 {go, 91, 9.} ， 和 一 个 新 的 转移 函数 
6p({qo, 91}, 0) = {qo0, 1, 92} 
接 下 来 ,使 4 = 1,i=0,j= 1,k=2， 得 到 
6N(qo, U6n(q1, DUSN(q2, 1) = {q1, 92} 


这 样 又 有 必要 引入 另 一 个 状态 {gq1, 9。 在 这 点 上 ， 我 们 构造 了 部 分 的 自动 机 ， 如 图 2-15 所 示 。 
因为 还 有 漏 掉 的 边 ， 所 以 我 们 继续 这 个 过 程 直到 得 到 如 图 2-16 所 示 的 最 终 的 完整 结果 。 口 





0 
图 2-15 图 2-16 


我 们 从 定理 2.2 中 得 到 的 一 个 重要 结论 是 被 nfa 接 受 的 语言 都 是 正则 的 。 
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习题 

1. 使 用 定理 2.2 种 的 构造 方法 把 图 2-10 中 的 nfa 转 化 成 dfa。 你 能 够 更 直接 地 看 出 一 个 更 简单 的 
答案 吗 ? 

2. 把 2.2 节 习题 11 的 nfa 转 化 成 为 一 个 等 价 的 dfa。 乔 

3. 把 下 面 的 nfa 转 化 成 等 价 的 dfa。 





4. 完成 定理 2.2 的 详细 证 明 。 给 出 下 面 结论 的 详细 证 明 : 如 果 B(go, w) 包含 %， 那 么 6y(go w) 也 包 
含 9r。 
5. 对 于 任意 nfa M = (Q, >, 6, go, F)，L(M) 的 补 集 等 于 集合 {wE5" : 6'(go, mw)np = 纷 是 否 成 
立 ? 如 果 成 立 ， 给 出 证 明 。 否 则 ， 给 出 反例 。 
6. 对 于 任意 nfa M = (Q, 2, 6, qo, F)，L(M) 的 补 集 与 集合 {wE5” : 6"(qo win(C - 汪 B} 相 等 是 
否 成 立 ? 如 果 成 立 ， 给 出 证 明 。 和 否则 ， 给 出 反例 。 
7. 证 明 : 不 论 一 个 nofa 有 多 少 个 终 态 ， 总 存在 一 个 与 之 等 价 的 只 有 一 个 终 态 的 nfa。dfa 是 否 存 
在 类 似 的 结论 敬 
8. 构造 一 个 没有 4 转移 ， 且 只 有 一 个 终 态 的 nfa， 接 受 集合 {a}U{b" :> 1 。 乔 
友 9. 设 L 是 不 包含 4 的 正则 语言 。 证 明 : 存在 一 个 没有 4 转移 ， 且 只 有 一 个 终 态 的 nfa 可 以 接受 
语言 L。 
10. 根据 2.2 节 习题 17 中 关于 nfa 的 定义 ， 类 似 给 出 一 个 具有 多 个 初 态 的 dfa 的 定义 是否 总 存在 
一 个 等 价 的 单 初 态 dfa? 
11. 证 明 所 有 的 有 穷 语言 都 是 正则 语言 。 秋 
.证 明 : 如 果 L 是 正则 语言 ， 那 么 Lf 也 是 。 
13. 给 出 图 2-16 中 dfa 接 受 的 语言 的 简单 口头 描述 。 根 据 这 个 描述 构造 另 一 个 与 之 等 价 的 dfa， 
要 求 构造 的 dfa 的 状态 数 要 更 少 。 
让 14. 设 L 是 任何 语言 。 定 义 even(w) 为 抽取 符号 串 w 中 偶数 位 置 的 符号 构成 的 符号 串 。 
即 : 如 果 


一 
[ed 


Ww = 010203G4… 
那么 
even(w) = Ch 
根据 上 述 定义 ， 我 们 可 以 定义 语言 
even(L) = {even(w) : wEL} 


证 明 : 如 果 L 是 正则 语言 ,那么 even(L) 也 是 。 独 
15. 已 知 语言 L， 我 们 把 L 中 每 个 符号 捉 的 最 左 端的 两 个 符号 去 掉 ， 获得 的 新 语言 是 chop2(L)。 
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形式 化 的 定义 为 
chop2(L) = {w : vwEL, 其 中 |y| = 2} 
证 明 : 如 果 Z 是 正则 的 ， 那 么 chop2(Z) 也 是 正则 的 。 锡 


2.4 减少 有 穷 自动 机 中 状态 的 化 简 * 


任何 一 种 dfa 都 定义 了 唯一 的 一 种 语言 ， 但 是 反之 就 不 一 定 对 了 。 对 于 一 种 给 定 的 语言 ， 
有 很 多 dfa 都 可 以 接受 它 。 这 些 等 价 的 自动 机 ， 它 们 的 状态 数目 可 能 差别 很 大 。 到 目前 为 止 ， 
我 们 考虑 的 问题 ， 无 论 什么 样 的 解 都 一 样 能 使 满意。 但 是 如 果 把 这 些 结果 应 用 到 实际 背景 
中 ， 就 会 存在 熟 优 熟 劣 的 问题 了 。 
例 2.14 ”输入 一 些 测试 符号 种 ， 会 很 快 发 现 图 2-17a 和 图 2-17b 中 描述 的 两 个 dfa 等 价 。 我 
们 可 能 会 注意 到 图 2-17a 具 有 一 些 明显 但 并 不 是 很 本 质 的 特点 。 在 自动 机 中 ， 状 态 gq; 根 本 没有 
用 ， 因 为 从 初 态 qo 根 本 到 不 了 它 。 这 种 状态 是 不 可 达 的 ， 因 此 ， 从 自动 机 中 类 掉 它 (以 及 所 
有 和 它 相 关 的 转移 ) 并 不 会 影响 自动 机 接受 的 语言 。 但 是 即使 去 掉 了 gs， 第 一 个 自动 机 仍然 
存在 着 元 余 。 第 一 次 迁移 不 管 是 使 用 6(qo, 0)， 还 是 使 用 Cgo, 1)， 后 面 的 可 达 状 态 都 是 相同 的 。 
第 二 个 自动 机 把 这 两 个 迁移 合并 了 。 口 [@2] 





图 2-17 


从 严格 的 理论 意义 上 讲 ， 选 择 图 2-17b 中 的 自动 机 而 不 选择 图 2-17a 中 的 自动 机 ， 几 平 是 没 
有 理由 的 。 但 是 无 论 如 何 ， 从 简单 的 角度 上 讲 ， 第 二 个 是 更 值得 推荐 的 。 以 计算 为 目的 的 自 
动机 的 表示 ， 需 要 的 空间 大 小 与 其 状态 数 成 正比 。 考 虑 到 存储 效率 ， 就 应 该 尽 可 能 地 减少 状 
态 数 。 我 们 现在 描述 一 种 能 够 达成 这 个 目的 的 算法 。 
定义 2.8 对 于 所 有 的 wE5"， 如 果 
0"(p,w)EF 意 味 着 6'(g, w)EF 
并 且 
6'(p,w) 锋 F 意 味 着 6'(q, w)F 
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则 称 dfa 的 两 个 状态 p 和 g 是 不 可 区 分 的 《indistinguishable )。 反 之 ， 如 果 存 在 符号 串 wE3 ， 使 得 
6'(p, w)EF 并 有 £6'(q, w)EF 


或 者 ， 反 之 亦 然 ， 那么 状态 p 和 gq 称 为 依靠 符号 束 w 可 区 分 的 (distinguishable )。 

很 明显 ， 两 个 状态 要 么 可 区 分 ， 要 么 不 可 区 分 ， 不 可 区 分 具有 一 个 等 价 关 系 的 属性 : 如 
果 p 和 gq 是 不 可 区 分 的 ， 并 且 4q 和 rr 也 是 不 可 区 分 的 ， 那 么 p 和 7r 就 是 不 可 区 分 的 ， 于 是 这 三 个 状 
态 都 是 不 可 区 分 的 。 

化 简 dfa 状 态 的 一 个 方法 是 基于 寻找 和 合并 不 可 区 分 状态 的 。 因 此 ， 我 们 首先 描述 一 种 寻 
找 可 区 分 状态 对 的 方法 。 

程序 : mark 

1. 去 掉 所 有 的 不 可 达 状 态 。 通 过 列举 dfa 图 中 所 有 起 点 为 初 态 的 简单 通道 ;就 可 以 完成 这 
一 点 。 任 何不 在 这 种 通道 上 的 状态 就 是 不 可 达 状 态 。 

2. 考察 所 有 的 状态 对 (p, 9)。 如 果 pEF 并 且 qgF， 或 者 反之 ， 把 状态 对 (p, 9) 标记 为 可 

3. 重复 下 述 过程 ， 直 到 不 再 有 前 面 未 标记 过 的 状态 对 。 

对 于 所 有 状态 对 (p, 9) 和 所 有 aE3， 计 算 6(p, a) = ps 和 6(q, a) = gu。 如 果 状 态 对 (p,, q。) 
标记 为 可 区 分 的 ， 那 么 把 状态 对 (p,qg) 也 标记 为 可 区 分 的 。 
我 们 称 这 个 程序 完成 了 标记 所 有 可 区 分 状态 对 的 算法 。 

定理 2.3 ”把 程序 mark 应 用 到 任何 dfa M = (Q, >, 6, go, F) 上 ， 程 序 者 会 停止 ， 并 且 可 以 确 
定 这 个 dfa 所 有 的 可 区 分 状态 对 。 
证 明 : 很 显然 ， 由 于 标记 的 可 区 分 状态 对 是 有 穷 的 ， 所 以 程序 一 定 会 停止 。 而 且 很 容易 看 出 ， 
如 此 标记 的 状态 对 一 定 是 可 区 分 的 。 唯 一 需要 证 明 的 是 ， 这 个 程序 能 找到 所 有 的 可 区 分 对 。 

注意 ， 首 先 状态 9 和 9 可 以 依靠 长 度 为 "的 符号 串 区 分 ， 当 且 仅 当 对 于 某 个 aEz 存 在 有 转 
移 函 数 

Hg;, a) = qx (2-5) 
和 
(gj, a) = gq (2-6) 

其 中 通过 长 度 为 n - 1 的 符号 串 区 分 两 个 状态 qu 和 qi。 

我 们 首先 使 用 这 个 来 证 明 完 成 a 次 第 3 步 的 循环 ， 所 有 可 以 依靠 长 度 不 超过 的 符号 申 区 分 
的 状态 都 被 作 以 标记 。 在 第 2 步 中 ， 我 们 标记 所 有 的 依靠 符号 串 1 区 分 的 状态 对 ， 因 此 我 们 就 
有 了 n = 0 作为 归纳 基础 。 我 们 现在 假设 对 于 i = 1, 0, …, n -1 的 所 有 命题 都 成 立 。 根 据 这 个 归 
纳 假设 ， 在 第 " 轮 循 环 开 始 时 ， 所 有 可 以 依靠 长 度 不 超过 z- 1 的 符号 串 来 区 分 的 状态 都 已 经 被 
标记 了 。 因 为 上 面 提 到 的 式 (2-5) 和 式 (2-6)， 这 轮 循环 结束 后 ， 所 有 可 以 依靠 长 度 不 超过 
?的 符号 串 来 区 分 的 状态 也 都 被 标记 了 。 根 据 归 纳 ， 我 们 可 以 认为 ， 对 于 任何 上 ， 完 成 第 nz 次 循 
环 后 ， 所 有 可 以 被 长 度 不 超过 n 的 符号 串 区 分 的 状态 对 都 被 标记 了 。 

为 了 证 明 这 个 程序 能 够 标记 所 有 可 区 分 的 状态 ， 假 设 循环 执行 "次 后 停止 。 这 就 意味 着 在 
第 "次 执行 过 程 中 ， 没 有 新 的 状态 可 被 标记 了 。 依 据 式 (2-5) 和 式 (2-6)， 不 存在 只 可 以 被 
长 度 为 的 符号 捉 区 分 的 (而 不 可 以 被 长 度 少 于 n 的 符号 串 区 分 的 ) 状态 。 但 是 如 果 不 存在 只 
可 以 被 长 度 为 "的 符号 串 区 分 的 状态 ， 那 么 也 就 不 会 存在 只 可 以 被 长 度 为 n+ 1 的 符号 串 区 分 的 
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状态 了 ， 依 此 类 推 。 因 此 ， 当 循环 停止 的 时 候 ， 所 有 可 以 区 分 的 对 都 应 该 被 标记 了 。 国 

执行 这 个 标记 程序 之 后 ， 我 们 使 用 这 个 结果 来 把 dfa 的 状态 集合 2 划分 成 不 相交 的 子 集 {q，， 
gj …,， gi}, {qi 49m，…, 49s}, …， 其 中 ， 任何 4EC 都 只 存在 于 一 个 子 集中 ， 每 个 子 集中 的 元 素 都 
是 不 可 区 分 的 。 但 是 不 同 子 集中 的 任意 两 个 元 素 是 可 以 区 分 的 。 使 用 本 节 后 面 的 习题 11 描 述 
的 结论 ， 可 以 证 明 这 种 划分 总 是 存在 的 。 根 据 这 些 子 集 ， 我 们 可 以 使 用 下 一 个 程序 来 构造 最 
小 的 自动 机 。 

程序 : reduce 

给 定 dfa M = (Q, ,6, go, )， 我 们 按照 下 面 的 方法 构造 简化 的 dfa M1 = (0,2,6,% ,站 。 

1. 使 用 程序 mark 来 找到 所 有 的 可 区 分 状态 对 。 然 后 根据 这 个 ， 按 照 上 面 提 到 的 方法 ， 把 
状态 集合 划分 成 由 所 有 不 可 区 分 状态 构成 的 集合 ， 比 如 ，{9 9 … ,9 时, {41, 4m，…, 4} 等 。 

2. 对 于 上 面 由 不 可 区 分 状态 构成 的 每 个 集合 {a 9, …, 49} ， 创 建 一 个 新 的 状态 ， 标 志 为 六 …k。 

3. 对 于 M 中 的 每 条 具有 下 述 形式 的 转移 规则 


0(q-,a) = 9 
找到 g, 和 gq, 属于 的 集合 。 如 果 g,E{g;, g, …, 9t}， 并 且 4,E{41, go …, 9,}， 那 么 增加 一 条 转移 规则 6 
6b.k,a) = lm 


4. 初 态 9 是 说 中 标记 包含 0 的 状态 。 

5. 天 是 所 有 标记 包含 i (其 中 i 满足 qJEF) 的 状态 集合 。 

例 2.15 考察 图 2-18 中 描绘 的 自动 机 。 

在 步骤 2 中 ， 程 序 mark 识 别 出 了 所 有 的 可 区 分 对 (go, 94)， (gi, 94)， (9g;, 94) 和 (gs, qs)。 
在 执行 步 又 3 的 循环 过 程 中 ， 程 序 计算 了 5g, 1) = qs 和 6(go, 1) = 93。 

既然 (gq;, 94) 是 可 区 分 对 ， 那 么 对 (go, 91) 也 应 该 被 标记 。 按 照 这 种 方式 继续 ， 这 个 标 
记 算 法 最 终 会 标记 (qo, q1)，(go, 9;)，( go, 93)，( go, q4)， (qi, 94)， (qs, 94) 和 (g3, 94) 这 些 
对 为 可 区 分 的 ， 而 (4q1, 92)，(q1, 93) 和 (gq,, 93) 是 不 可 区 分 的 。 因 此 ， 状态 gq1, q;, 9; 都 是 不 
可 区 分 的 。 所 有 的 状态 分 成 了 三 个 集合 {go}, {41, 92, 93} 和 {94}。 应 用 程序 reduce 中 的 步骤 2 和 
步骤 3， 得 到 了 图 2-19 中 的 dfa。 口 


0 0,1 





图 2-18 


定理 2.4 给 定 dfa M， 应 用 程序 reduce 可 以 得 到 另 一 个 dfa 及 ， 满 足 
LM)= L(M) 
而 且 ， 及 是 最 小 的 。 这 里 的 最 小 指 的 是 它 是 所 有 接受 L(M) 的 dfa 中 状态 数 最 少 的 。 
证 明 : 证 明 包括 两 部 分 。 第 一 部 分 证 明 使 用 reduce 生 成 的 dfa 和 原始 的 dfa 等 价 。 这 个 相对 容易 
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一 些 。 我 们 可 以 使 用 证 明 dfa 与 nfa 等 价 中 用 到 的 类 似 的 归纳 证 明 。 我 们 需要 做 的 仅仅 是 证 其 
5"(qi,w) = gj 当 且 仅 当 6'(q,,w) 的 标志 是 …j… 这 样 的 形式 。 我 们 把 这 个 证 明 留 作 习 题 。 

第 二 部 分 来 证 明 好 是 最 小 的 ， 这 个 有 点 难度 。 假设 必 有 状态 {po, pi, p，， “7, pn}, Po 是 初 态 。 
假设 存在 一 个 等 价 的 dfa M,。 它 的 转移 函数 是 56, ， 初 态 是 Yo。 它 和 应 等 价 ， 但 是 状态 数 更 少 。 
因为 故 中 没有 不 可 达 状 态 ， 所 以 一 定 存在 不 同 的 符号 串 wi, w;, …, w,， 满 足 

6° (po wi) = pisi =1,2,.,m 
但 是 既然 M 的 状态 数 比 习 少 ， 那 么 一 定 至 少 存在 两 个 符号 囊 ， 假 设 w. 和 wj;， 满 足 
61 (go, wi) = 6) (qo,w) 
因为 p. 和 p, 是 可 区 分 的 ， 所 以 ， 一 定 存在 某 个 符号 串 x， 使 得 6"(po,wx) =6'(p,,x) 是 终 态 ， 并 
且 6"(go,wx)=6"(p,,x) 是 非 终 态 (或 恰好 相反 )。 换 旬 话 说 ，wx 可 以 被 应 接 受 ， 而 wx 则 不 能 
被 让 接受 。 但 是 注意 
61 (qo, wix) = 67 (6; (qo, wi ), x) 
= 61 (67 (qo, wi), x) 
= 6 (go, wx) 
因此 ，M 要 么 接受 wx 和 wix， 要 么 都 不 接受 。 这 与 应 和 M, 等 价 的 假设 矛盾 。 这 个 矛盾 证 明了 
Mi 不 存在 。 转 


习题 


1. 最 小 化 图 2-16 中 dfa 的 状态 数 。 
2. 寻找 接受 下 面 语言 的 最 小 dfa， 分 别 证 明 它 们 的 结果 是 最 小 的 : 
(a)L= {a'b”:n22,m2>1} 
(b)L= {ab:n20}U{b"a:n>21} 
(OL=t{a':n>0,n*r3} 秘 
(d)L= {a':n2,n*4} 
3. 证 明 使 用 程序 reduce 生 成 的 自动 机 是 确定 的 。 
4. 最 小 化 下 图 中 描绘 的 dfa 的 状态 数 。 者 
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5. 证 明 : 如 果 L 是 非 空 语言 ， 并 且 L 中 的 任何 符号 串 w 的 长 度 至 少 为 +， 那 么 ， 接 受 L 的 dfa 至 少 
有 + 1 个 状态 。 
6. 证 明 下 面 的 猜想 成 立 ， 或 不 成 立 。 如 果 M = (Q, ,6, qo, F) 是 接受 正则 语言 L 的 最 小 dfa， 那 
么 村 =(Q,7,6,go,0- 玉 ) 是 接受 语言 工 的 最 小 dfa。 志 
7. 证 明 : 不 可 区 分 性 是 等 价 关 系 ， 而 可 区 分 性 不 是 。 
8. 给 出 定理 2.4 第 一 部 分 的 详细 证 明 。 即 : 证 明 应 和 原始 dfa 等 价 。 
妈妈 9. 对 于 任意 给 定 的 dfa， 给 出 产生 与 之 等 价 的 最 小 dfa 的 程序 。 
10. 证 明 下 面 命题 : 如 果 状 态 q9, 和 gs 是 不 可 区 分 的 ， 并 且 4, 和 和 4. 是 可 区 分 的 ， 那 么 ，gs 和 4 一定 
是 可 区 分 的 。 才 [68] 
1. 完成 程序 mark 之 后 ， 进 行 下 面 过 程 。 从 蘑 个 状态 开始 ， 比 如 说 gq。。 把 所 有 没有 标记 为 与 g。 
可 区 分 的 状态 放 到 go 的 等 价 集合 中 。 然 后 ， 再 取出 另 一 个 状态 (不 属于 前 面 已 经 划 定 的 等 
价 集合 )， 重 复 同样 的 操作 。 反 复 进行 上 述 过 程 ， 直 到 处 理 完 所 有 的 状态 。 接 着 ， 把 上 述 
过 程 形式 化 ， 写 成 一 个 算法 。 证 明 这 个 算法 确实 能 够 把 原始 的 状态 集合 划分 成 若干 个 等 价 
的 状态 集合 。 [名] 





第 3 章 正则 语言 与 正则 文法 


根据 我 们 的 定义 ， 如 果 一 种 语言 能 够 被 一 个 有 穷 接 受 器 接受 ， 那 么 这 种 语言 就 是 正则 语 
。 因 此 ， 每 种 正则 语言 都 可 以 被 某 个 dfa 或 nfa 摘 述 。 这 种 描述 很 有 用 ， 比 如 ， 我 们 想 通过 罗 
辑 证 明 一 个 给 定 的 符号 串 是 否 属于 某 种 语言 。 但 是 很 多 时 候 ， 我 们 需要 更 加 简明 的 方法 来 描 
述 正则 语言 。 在 本 章 中 ， 我 们 介绍 描述 正则 语言 的 其 他 方式 。 这 些 表示 方法 有 着 重要 的 实际 
应 用 ， 我 们 将 通过 一 些 例子 和 习题 来 了 解 这 些 应 用 。 


3.1 正则 表达 式 


一 种 描述 正则 语言 的 方式 是 使 用 正则 表达 式 (regular expression) 的 表示 方法 。 这 种 表示 方 
法 包含 了 字母 表 > 上 的 符号 构成 的 符号 串 、 贺 括号 及 操作 符 二 ，. 和 * 的 组 合 。 最 简单 的 情况 是 
语言 {a}， 这 个 语言 用 正则 表达 式 a 来 表示 。 稍 微 复杂 点 的 语言 {a, b, c}， 是 用 + 来 表示 并 集 ， 它 
的 正则 表达 式 是 a + b + c。 按 照 类 似 的 方式 ， 我 们 使 用 表示 连接 ，* 表 示 星 闭 包 。 表 达 式 (a + 
b. c)* 表 示 {a}Ut{bc} 的 星 闭 包 。 即 : 它 代表 的 语言 是 {4, a, bc, aa, abc, bca, bcbc, aaa, aabc,…}。 


了 


3.1.1 正则 表达 式 的 形式 化 定义 


我 们 对 基本 构成 成 分 重复 地 使 用 某 种 递归 规则 来 构造 正则 表达 式 ， 这 和 我 们 构造 算术 表 
达 式 的 方式 是 类 似 的 。 

定义 3.1 设 > 是 给 定 的 字母 表 ， 那 么 

1.@，A 和 aE5 都 是 正则 表达 式 。 这 些 叫 做 基本 正则 表达 式 (primitive regular expression ) 。 

2. 如 果 r1 和 /5 是 正则 表达 式 ， 那 么 Ti fy，Ti 了 2， Ti 和 (71) 也 是 正则 表达 式 。 

3. 当 且 仅 当 把 规则 2 有 限 次 地 应 用 于 基本 正则 表达 式 得 到 的 符号 事 ， 才 是 正则 表达 式 。 

例 3.1 已 知 Z = {a,b,c}， 符号 串 

(at+rb:o*.(c+) 


是 正则 表达 式 ， 因 为 它 是 按照 上 面 的 规则 构造 的 。 例 如 ， 如 果 我 们 取 r, = c，r; = 名 ， 我 们 会 
发 现 c + 8B 和 (c + 乡 ) ， 也 都 是 正则 表达 式 。 重 复 这 个 过 程 ， 我 们 最 终 产 生 了 所 有 的 符号 串 。 
另外 ，(a + b+) 不 是 正则 表达 式 ， 因 为 它 不 能 用 基本 的 正则 表达 式 来 构造 。 口 


3.1.2 ”和 正则 表达 式 相关 的 语言 


正则 表达 式 可 以 用 来 描述 一 些 简单 语言 。 如 果 r 是 正则 表达 式 ， 我 们 就 用 L(r) 表示 和 r 相 关 
的 语言 。 这 个 语言 的 定义 如 下 : 

定义 3.2 使 用 正则 表达 式 r 表 示 的 语言 L(r)， 由 下 面 规 则 定义 : 

1. GB 是 表示 空 集 的 正则 表达 式 。 

2. A 是 表示 {入 } 的 正则 表达 式 。 
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3. 对 于 每 个 aEZ ，a 是 表示 {a} 的 正则 表达 式 。 
如 有 果 r 和 5 是 正则 表达 式 ， 那 么 
4.L(ri +r,) = Lr)UL(r,), 
$5.L(ri: 1) = Lr)L(r,)。 
6.Z(rD) = L(r,), 
7.Z(rD = (Cr 六。 
定义 的 后 4 条 规则 递归 地 把 L(r) 转化 成 更 简单 的 成 分 。 前 三 条 是 这 个 递归 的 终止 条 件 。 为 了 弄 
清楚 给 定 的 表达 式 表 示 的 是 什么 语言 ， 我 们 反复 使 用 上 面 这 些 规则 。 
例 3.2 用 集合 形式 表示 语言 L(a* ' (a + 5b))。 
La : (a +b))=L(a')L(a + b) 
= (L(a)) (L(YUL(D)) 
= {A, a, aa, aaa, *…}{a, b} 
= {a, aa, aaa, *…, b, ab, aab, …} 口 
定义 3.2 中 的 规则 4 至 规则 7 存在 一 个 问题 。 如 果 给 定 记 和 疡 ， 它 们 可 以 准确 地 定义 语言 ， 但 
是 把 一 个 复杂 的 表达 式 拆 分 成 几 部 分 ， 拆 分 可 以 按照 很 多 种 方式 进行 ， 因 此 会 造成 拆 分 的 歧 
义 性 。 例如 ,正则 表达 式 a . b+ c。 我 们 可 以 把 它 看 成 是 由 rl = ae b 和 r, = c 组 成 的 。 这 样 的 话 ， 
我 们 就 得 到 L(a . b+ c) = {ab, c}。 但 是 根据 定义 3.2， 我 们 也 可 以 拆 分 成 m = a 和 r，, = b+ c。 这 
样 就 得 到 了 一 个 不 同 的 结果 ，、，L(a . b + c) = {ab, ac}。 为 了 避免 这 种 情况 的 发 生 ， 我 们 就 需要 
将 所 有 的 表达 式 都 用 圆 括号 括 起 来 ， 但 是 这 样 得 到 的 结果 又 过 于 麻烦 了 。 于 是 ， 我 们 使 用 数 
学 和 程序 设计 语言 中 类 似 的 规定 ， 建 立 一 套 优先 级 规则 ， 从 而 确定 星 闭 包 要 优先 于 连接 ， 连 
接 又 优先 于 并 。 另 外 ， 连 接 的 符号 可 以 省 略 ， 因 此 我 们 使 用 rir, 代 替 7，: +,。 
稍 做 练习 之 后 ， 我 们 很 快 就 可 以 清楚 一 个 特殊 的 正则 表达 式 表示 的 是 什么 样 的 语言 。 
例 3.3 已 知 Z = {a,5}， 表 达 式 
r=(a+b)'(a+ bb) 
是 正则 的 。 它 表示 语言 
ZL(r) = {a, bb, aa, abb, ba, bbb, …} 
分 别 考察 /的 各 部 分 ， 我 们 就 可 以 得 出 上 面 的 结论 。 第 一 部 分 是 (a + 5b)"， 代 表 a 和 4b 构成 的 任 
意 符 号 串 。 第 二 部 分 是 〈a + bb)， 表 示 一 个 a， 或 者 两 个 b。 因 此 ，L(r) 表示 {a, b} 上 的 所 有 以 
4 或 2 结尾 的 符号 串 。 口 
例 3.4 表达 式 
r= (aay'(bb)'b 
表示 偶数 个 a， 后 面 跟着 奇数 个 5 的 所 有 符号 串 的 集合 。 即 : 
L(r)= {a”b™+! :n>20,m>0} 
根据 非 形式 化 的 描述 或 集合 表示 来 确定 其 正则 表达 式 会 更 困难 。 口 
例 3.5 已 知 2 = {0,1}， 给 出 一 个 满足 下 面 描 述 的 正则 表达 式 r 
Zr) = {wE2 ” : w 至 少 有 一 对 连续 的 0} 
根据 下 面 的 推理 可 以 得 到 结果 : L(r) 中 的 每 个 符号 串 一 定 包含 00， 但 是 00 之 前 与 之 后 的 符号 
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完全 是 任意 的 。{0, 1} 上 的 任意 符号 串 可 以 表示 为 (0 + 1) 。 把 这 些 分 析 放 在 一 起 ， 我 们 得 到 
结果 为 

r=(0+1)00(00+17 口 

例 3.6 为 下 面 的 语言 构造 正则 表达 式 
L= {wE{0, 1} : w 中 不 存在 连续 的 0} 
尽管 这 个 看 起 来 和 例 3.5 类 似 ， 但 是 构造 起 来 要 更 困难 些 。 根 据 观察 得 到 一 个 有 帮助 的 结论 是 : 
0 的 后 面 一 定 紧 跟着 1。 这 个 子 串 的 前 面 和 后 面 还 可 以 有 任意 个 1。 这 就 暗示 我 们 结果 应 该 包含 
1…101…1 形 式 的 重复 的 符号 串 ， 即 : 这 种 语言 应 该 用 正则 表达 式 (1"0117" 来 表示 。 然 而 ， 结 
果 还 不 完整 ， 因 为 我 们 还 没有 考虑 以 0 结束 的 符号 串 或 全 部 由 1 构成 的 符号 串 这 两 种 情况 。 把 
上 面 的 这 些 特殊 情况 考虑 在 内 ， 我 们 得 到 结果 为 
r=(1011) (0+A)+1'(0+A) 


如 果 我 们 将 推理 稍 做 变化 ， 就 可 以 得 到 另 一 个 结果 。 如 果 我 们 把 L 看 成 是 符号 串 1 和 01 的 
重复 ， 那 么 可 以 得 到 比较 短 的 止 则 表达 式 
r=(1+01)(0+A) 


尽管 两 个 结果 看 起 来 不 同 ， 但 它们 都 是 正确 的 ， 因 为 它们 表示 的 是 同一 种 语言 。 通 常 ， 任 意 
给 定 一 种 语言 都 可 以 由 无 限 种 正则 表达 式 来 表达 。 

注意 这 个 语言 是 例 3.5 中 的 语言 的 补 。 然 而 ， 这 两 个 正则 表达 式 并 不 非常 相似 ， 不 能 轻易 
看 出 这 两 种 语言 之 间 的 紧密 联系 。 口 

最 后 的 例子 中 引入 了 正则 表达 式 的 等 价 表示 。 如 果 两 个 正则 表达 式 表 示 的 是 同一 种 语言 ， 
那么 我 们 就 称 它们 是 等 价 的 。 我 们 可 以 推导 出 大 量 简化 正则 表达 式 的 规则 ( 详 见 本 节 的 习题 
18)， 但 是 因为 我 们 很 少 需要 使 用 这 种 处 理 ， 所 以 我 们 不 再 谈 这 方面 的 问题 。 


习题 


1 .在 L((a + ba + ab)) 中 找到 长 度 少 于 4 的 所 有 符号 串 。 

2. 表达 式 ((0 + 1D)(0 + 1 7)00(00 + 1 表示 的 是 例 3.5 中 的 语言 吗 ? 和 过 
3. 证 明 r = (1 + 01)'(0+1) 也 可 以 表示 例 3.6 中 的 语言 。 找 到 另外 两 个 等 价 的 表达 式 。 
4. 为 集合 {a"b" : (n+ m) 是 偶数 } 构 造 一 个 正则 表达 式 。 

. 为 下 列 语言 构造 正则 表达 式 : 

(a) Zi = {a'b”,n>4,m<3} 别 

(b) 万 = {ab”,n<4,m<«3} 

(c) 荆 的 补 集 徊 

(d) 工 的 补 集 

表达 式 (@”) 和 a@g 分 别 表 示 的 是 什么 语言 ? 

.对 语言 L((aa) b(aa) + a(aa)'ba(aa)”)， 给 出 一 个 简单 的 口头 描述 。 
已 知 L 是 习题 1 中 的 语言 ， 给 出 Lx 的 正则 表达 式 。 

.给 出 L = {arb” ;n>1,m>1,nm>3} 的 正则 表达 式 。 药 

10. 给 出 = {ab”w :n>3,wEf{a,b}*} 的 正则 表达 式 。 


(An 
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11. 为 例 3.4 中 的 语言 的 补 集 构 造 正 则 表达 式 。 
12. 为 上 = {vwv :iv wEfa,pb |v| = 2} 构 造 正 则 表达 式 。 者 
13. 为 L = {wE{0, 1}' : w 有 且 只 有 一 对 连续 的 0} 构 造 正则 表达 式 。 
14. 为 下 面 定 义 在 = {a, b,c} 上 的 语言 构造 正则 表达 式 : 
(a) 有 且 只 有 一 个 a 的 所 有 符号 串 。 
(b) 仅 有 3 个 ea 的 所 有 符号 串 。 
(c) 包含 2 上 所 有 字母 的 符号 串 。 蓟 
(d) a 的 长 度 不 超过 2 的 所 有 符号 串 。 
克 (e) a 的 长 度 为 3 的 倍数 的 所 有 符号 申 。 
15. 分 别 写 出 下 列 定义 在 {0, 1} 上 的 语言 的 正则 表达 式 : 
(a) 结束 符 为 01 的 所 有 符号 串 。 
(b) 结束 符 不 是 01 的 所 有 符号 串 。 
(c) 包含 偶数 个 0 的 所 有 符号 串 。 蓓 
(d) 至 少 包含 两 个 00 子 串 的 所 有 符号 串 〈 注 意 ， 通 常 认 为 000 包 含 两 个 这 样 的 子 串 )。 
(e) 子 串 00 至 多 出 现 两 次 的 所 有 符号 串 。 
玄 (f) 不 包含 子 串 101 的 所 有 符号 串 。 
16. 为 下 列 定义 在 {a, b} 上 的 语言 构造 正则 表达 式 : 
(a) L={w:|wimod3=0} 沉 
(b) L={w:n, (wmod3=0} 
(c) L={w:n, (wmod 5>0} 
17. 把 习题 16 中 的 字母 表 变 成 2 = {a, b, c}， 分 别 构造 能 够 接受 上 面 (a)、(b) 和 (c) 的 正则 
18. 已 知 任意 正则 表达 式 r, 和 x,， 确 定 下 列 结论 是 否 成 立 。 符 号 三 表示 正则 表达 式 等 价 ， 即 : 
两 种 正则 表达 式 表示 的 是 同一 种 语言 。 
(a) (r)'=ri 
(b) 三 (+ r2) (7r) + rr) 
(c) (+r) =(rir 寺 
(d) (mr 三 门户 
19. 给 出 一 个 通用 的 方法 ， 能 够 把 正则 表达 式 r 变 成 ?， 满 足 (L(r))* = L()。 
20. 严格 证 明 例 3.6 中 的 表达 式 确实 表示 的 是 指定 的 语言 。 
21. 已 知 正则 表达 式 : 不 包含 4 或 8， 如 果 L(n) 是 无 穷 的 ， 给 出 必须 满足 的 充分 必要 条 件 。 贰 
22. 形式 语言 可 以 用 来 描绘 二 维 图 形 。 循 环 码 语言 是 定义 在 字母 表 5 = {wd,7, 中 上 的 ， 其 中 ， 字 母 
表 中 的 这 些 符 号 分 别 表示 方向 为 上 、 下 、 右 和 左 的 单位 长 度 的 直线 。 使 用 这 个 表示 的 一 个 例 
子 wdl， 表 示 的 是 边 为 单位 长 度 的 正方 形 。 画 出 表达 式 (rd》，(urddru)* 和 (ruldr)' 表 示 的 图 形 。 
23. 根据 习题 22 中 的 定义 ， 表达 式 要 满足 什么 样 的 充分 条 件 ， 才 能 使 得 画 出 的 图 形 是 闭合 的 
( 即 起 点 和 终点 是 相同 的 ) ? 这 些 条 件 是 必需 的 吗 ? 志 
24. 构造 接受 语言 L(aa"(a + 5b)) 的 nfa。 
25. 构造 正则 表达 式 表示 所 有 的 位 串 : 当 把 这 个 位 串 解 释 成 二 进 制 数 时 ， 它 的 值 大 于 或 等 于 
40。 千 
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26. 构造 正则 表达 式 表示 所 有 的 位 串 ， 其 开始 位 为 1， 并 且 把 这 个 位 串 解 释 成 二 进 制 数 时 ， 它 
的 值 不 在 10 和 30 之 间 。 


3.2 正则 表达 式 和 正则 语言 之 间 的 联系 


从 术语 字面 上 看 来 ， 正 则 表达 式 和 正则 语言 之 间 的 联系 应 该 很 紧密 。 这 两 个 概念 从 本 质 
上 说 是 相同 的 。 对 于 每 一 个 正则 语言 ， 都 可 以 找到 一 个 正则 表达 式 来 表示 它 。 而 每 一 种 正则 
表达 式 表示 也 都 对 应 着 一 种 正则 语言 。 我 们 将 分 别 证 明 这 两 部 分 。 


3.2.1 正则 表达 式 表示 正则 语言 


我 们 首先 证 明 如 果 r 是 正则 表达 式 ， 那 么 L(r) 则 是 正则 语言 。 根 据 我 们 的 定义 有 ， 如 果 一 
个 语言 可 以 被 某 个 dfa 接 受 ， 那 么 它 就 是 正则 语言 。 由 于 nfa 和 dfa 等 价 ， 所 以 ， 如 果 一 个 语言 
可 以 被 某 个 nfa 接 受 ， 那 么 它 也 是 正则 语言 。 我 们 首先 证 明 : 已 知 任意 正则 表达 式 +， 我 们 都 能 
构造 一 个 接受 L(r) 的 nfa。 构 造 的 方法 依赖 于 L(r) 的 递归 定义 。 我 们 首先 构造 简单 的 自动 机 满 
足 定义 3.2 的 (1)、{2) 和 (3) 这 3 部 分 。 然 后 证 明 使 用 这 几 个 简单 的 自动 机 ， 我 们 可 以 构造 
更 加 复杂 的 自动 机 满足 第 (4)、 第 (5) 和 第 (7) 部 分 。 

定理 3.1 设 r 是 正则 表达 式 。 那 么 ， 一 定 看 在 某 个 非 确 定型 有 穷 接 受 器 接受 L(r)。 因 此 ， 
L(r) 是 正则 语言 。 
证 明 : 我 们 首先 构造 接受 简单 正则 表达 式 B6， 和 和 aE5 表 示 的 语言 的 自动 机 。 它 们 分 别 如 图 3-1 的 
alj、b)、c) 所 示 。 假 设 我 们 分 别 用 自动 机 Mr) 和 M(r,) 接受 正则 表达 式 r, 和 r, 表 示 的 语言 。 我 们 
不 必 直 接 构造 这 些 自动 机 ， 可 以 示意 性 地 表示 它们 ， 如 图 3-2 所 示 。 在 这 个 示意 图 中 , 图 中 左边 
的 顶点 表示 初 态 ， 右 边 的 顶点 表示 终 态 。 在 2.3 节 习题 7 中 ， 我 们 证 明了 对 于 任何 nfa， 总 存在 一 
个 与 之 等 价 的 单 终 态 nfa。 因 此 ， 我 们 这 里 可 以 假设 只 有 一 个 终 态 。 我 们 用 这 种 方式 表示 Mri) 
和 AM(r)， 接 下 来 ， 为 正则 表达 式 + 疡 ，mra 和 ri 构造 自动 机 。 构 造 过 程 如 图 3-3 至 图 3-5 所 示 。 
正如 图 中 指出 的 ， 作 为 构成 成 分 的 自动 机 的 初 态 和 终 态 分 别 被 新 的 初 态 和 终 态 代替 。 按 照 上 面 
的 这 几 个 步骤 ， 我 们 可 以 为 任意 复杂 的 正则 表达 式 构造 自动 机 。 


a) 接受 B 的 nfa b) 接受 {4A} 的 nfa 0) 接受 {a} 的 nfa 


图 3-1 





MI(r) 











MI(?) 








图 3-2 nfa 楼 受 L(r) 的 示意 图 图 3-3 接受 Zr + 六) 的 自动 机 














图 3-5 接受 L(ri) 的 自动 机 


通过 图 3-3 至 图 3-5 的 解释 ， 我 们 可 以 更 加 清楚 这 个 构造 过 程 。 为 了 论证 的 严密 性 ， 我 们 给 
出 由 构成 成 分 的 状态 和 转移 函数 来 构造 合并 的 自动 机 的 状态 和 转移 函数 的 形式 化 方法 。 然 后 
通过 对 构造 过 程 中 运算 的 数目 作 归 纳 ， 来 证 明 这 样 可 以 构造 一 个 接受 用 某 种 正则 表达 式 表 示 
的 语言 的 自动 机 。 对 这 点 我 们 不 再 详细 讨论 ， 因 为 这 个 结论 显然 总 是 正确 的 。 熏 
例 3.7 构造 一 个 nfa 接 受 L(r)， 其 中 
r=(a+bb) (ba’ + A) 


(a+ bb) 和 (ba + 人) 的 自动 机 ， 直 接 按 照 第 一 个 原则 构造 ， 具 体 如 图 3-6 所 示 。 使 用 定理 3.1 把 
这 些 组 合 在 一 起 ， 就 得 到 图 3-7 中 的 结果 。 口 

















75 
80 图 3-7 接受 (a + bb) (ba’ + 加)) 的 自动 机 


3.2.2 正则 语言 的 正则 表达 式 
从 直观 上 看 ， 定 理 3.1 的 逆 命题 也 应 该 成 立 。 即 : 对 于 任何 一 个 正则 语言 ， 都 存在 与 它 相 
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应 的 正则 表达 式 。 因 为 任何 正则 语言 都 存在 着 与 之 相关 的 nfa， 因 此 也 存在 着 与 之 对 应 的 转移 
图 。 我 们 需要 做 的 就 是 找到 一 个 正则 表达 式 ， 使 得 它 能 够 生成 从 go 到 任意 终 态 的 所 有 通道 上 
的 标记 。 这 点 看 起 来 并 不 困难 ， 但 是 由 于 回路 的 存在 可 能 会 把 问题 变 复杂 ， 因 为 回路 可 以 按 
照 任 何 顺序 重复 经 过 任意 次 。 这 就 产生 了 一 个 必须 仔细 处 理 的 籍 记 问题 。 解 决 这 个 问题 的 方 
法 很 多 ， 一 个 比较 直观 的 方法 是 利用 所 谓 的 通用 转移 图 (generalized transition graph )。 因 为 
这 种 思想 在 这 里 是 按照 某 种 受 限 制 的 方式 使 用 的 ， 对 于 将 来 的 讨论 没 起 到 什么 作用 ， 所 以 ， 
我 们 在 这 里 只 是 非 形式 化 地 介绍 一 下 。 

通用 转移 图 是 边 标 有 正则 表达 式 的 转移 图 。 它 的 其 他 方面 和 -一般 的 转移 图 是 一 样 的 。 从 
初 态 到 终 态 的 通道 上 的 标记 形成 了 儿 个 正则 表达 式 的 连接 。 因 此 ， 它 本 身 就 是 一 个 正则 表达 
式 。 被 上 述 的 正则 表达 式 表 示 的 符号 串 ， 就 是 能 够 被 通用 转移 图 接受 的 语言 的 子 集 。 所 有 这 
样 的 子 集 的 并 ， 就 是 该 通用 转移 图 接受 的 语言 的 全 集 。 

例 3.8 ”图 3-8 表 示 一 个 通用 转移 图 。 考 察 这 个 图 可 以 清晰 地 得 到 它 接受 的 语言 是 La" + 
a (a + bc)。 标 有 a 的 边 (qo, qo) 是 一 个 回路 ， 这 个 回路 能 够 产生 任意 个 数 的 a， 即 : 它 可 以 


生成 L(a)。 我 们 可 以 改 用 a' 标 记 这 条 边 ， 而 且 不 改变 图 接受 的 语言 。 口 
非 确定 型 有 穷 接 受 器 的 图 都 可 以 看 成 是 通用 转移 图 ， 如 果 边 的 , 网 

标记 都 可 以 正确 地 解释 的 话 。 一 个 标 有 单 符号 a 的 边 可 以 解释 成 标 

有 表达 式 a 的 边 ， 而 标 有 多 个 符号 a, 5, … 的 边 可 以 解释 成 标 有 表达 | 


式 a + b +… 的 边 。 根 据 这 个 观察 结果 ， 我 们 可 以 得 出 结论 ， 对 于 任 GO e+ C)» 
何 正则 语言 ， 总 存在 一 个 通用 转移 图 接受 它 。 反 之 ， 每 个 被 通用 转 
移 图 接受 的 语言 都 是 正则 的 。 因 为 通用 转移 图 中 通道 上 的 标记 都 是 图 3-8 
正则 表达 式 ， 因 此 可 以 应 用 定理 3.1 立 即 得 到 这 个 结论 。 无 论 如 何 ， 证 明 中 存在 一 些 精 巧 之 处 ， 
我 们 就 不 在 这 里 进一步 的 介绍 了 ， 把 它 的 详细 证 明 留 给 读者 作为 习题 ， 见 4.3 节 习题 16。 

通用 转移 图 的 等 价 性 可 以 通过 它们 接受 的 语言 来 定义 。 考 虑 一 个 具有 状态 {9, g,, g, …} 的 
通用 转移 图 ， 其 中 ，g 既 不 是 终 态 也 不 是 初 态 。 我 们 想 要 构造 一 个 去 掉 状态 g 的 通用 转移 图 ， 
使 它 与 原 通用 转移 图 等 价 ， 如 果 我 们 不 改变 从 go 到 4 的 过 程 中 所 产生 的 标记 集合 表示 的 语言 ， 
那么 我 们 可 以 做 到 这 点 。 这 个 构造 过 程 可 以 参照 图 3-9 中 的 解释 。 其 中 ， 在 图 3-9 中 ， 要 去 掉 状 
态 9， 边 标记 a, b, … 表 示 -- 般 的 表达 式 。 由 于 g 有 到 三 个 顶点 g,, g,, 4 的 输出 边 ， 在 这 个 意义 上 ， 
该 情况 描述 的 是 一 种 最 通用 的 情况 。 若 要 去 掉 图 3-9a 中 的 边 ， 我 们 就 要 去 掉 其 在 图 3-9b 中 对 应 


2 ae'd ce 
a C0 Ce 
a) b) 


图 3-9 
图 3-9 的 构造 过 程 证 明了 需要 引入 一 些 边 ， 从 而 保证 当 我 们 去 掉 9 及 其 所 有 的 输入 、 输 出 
边 时 ,通用 转移 图 对 应 的 语言 不 会 改变 。 完 整 的 处 理 过 程 需要 我 们 在 去 掉 g 之 前 ， 对 于 Q {9g} 
中 的 所 有 对 (g;, q,)， 都 要 完成 上 述 过 程 。 尽 管 我 们 不 会 形式 化 地 证 明 这 点 ， 但 是 这 点 可 以 通 
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过 构造 一 个 等 价 的 通用 转移 图 来 证 明 。 接 受 这 点 之 后 ， 我 们 准备 开始 证 明 如 何 把 任意 一 个 nfa 
和 一 个 正则 表达 式 关联 起 来 。 
定理 3.2 设 L 是 正则 语言 。 那 么 总 存在 正则 表达 式 :， 使 得 L = L(7)。 

证 明 : 设 M 是 接受 L 的 nfa。 我 们 可 以 不 损失 任何 通用 性 地 作出 假设 : M 只 有 一 个 终 态 ， 并 且 
4oEF。 我 们 把 M 的 图 解释 成 通用 转移 图 ， 并 应 用 上 述 构 造 方法 。 为 了 去 掉 标 有 4 的 顶点 ， 我 们 
使 用 图 3-9 中 的 方案 处 理 所 有 的 对 (9;, 9;))}。 加 入 所 有 的 新 边 后 ， 去 掉 q 以 及 所 有 与 之 相关 的 边 。 
我 们 继续 这 个 过 程 ， 一 个 顶点 接着 一 个 顶点 地 移 除 ， 直 到 变 成 图 3-10 中 的 情形 。 被 上 述 图 接 
受 的 语言 对 应 的 正则 表达 式 是 | | 


r=rnn(n +tnn pp) “(3-1) 


因为 所 有 通用 转移 图 的 推导 序列 都 等 价 于 初始 的 那 一 个 。 所 以 我 
们 对 通用 转移 图 中 的 状态 数 作 归纳 ， 从 而 证 明 式 (3-1) 中 的 正 
则 表达 式 表示 的 是 语言 上 。 国 

例 3.9 ”考虑 图 3-11a 中 的 nfa。 除 去 状态 ao ， 得 到 的 相应 通用 
转移 图 如 图 3-11b 所 示 。 识 别 出 它 的 组 成 部 分 分 别 为 ri = b + ab'a， 
r= ab'b,r;= 人 ,r=a+b， 我 们 最 终 得 到 这 个 原始 自动 机 对 应 的 
正则 表达 式 为 





r=(b+ab'a)'ab'b(a + b)” 


定理 3.2 的 构造 过 程 宛 长 ， 而 且 给 出 的 解 比较 长 ， 但 这 是 一 个 有 固定 步骤 的 方法 ， 而 且 它 总 是 
有 效 的 。 


b+tab’a a+b 





b) 





例 3.10 为 下 面 语言 构造 正则 表达 式 
L= {wE{a,b}) : ns(w) 是 偶数 ， 并 且 ns(w) 是 奇数 } 

直接 根据 描述 去 构造 正则 表达 式 会 遇 到 各 种 困难 。 另 一 方面 ， 只 要 我 们 有 效 地 利用 顶点 标记 ， 
我 们 就 能 够 容易 地 构造 出 接受 它 的 nfa。 我 们 用 标记 为 EE 的 顶点 
来 表示 a 和 4b 的 个 数 都 是 偶数 个 。 用 标记 为 OE 的 顶点 表示 的 a 个 
数 是 奇数 ，2 的 个 数 是 偶数 ， 等 等 。 使 用 这 种 方法 ， 我 们 可 以 很 
容易 得 到 相应 的 nfa 解 ， 如 图 3-12 所 示 。 

我 们 现在 使 用 机 械 的 方式 把 它 转化 成 正则 表达 式 。 首 先 ， 
我 们 去 掉 标 记 为 OE 的 状态 ， 得 到 的 通用 转移 图 见 图 3-13。 

然后 ， 我 们 去 掉 标 有 OO 的 顶点 ， 得 到 的 结果 是 图 3-14。 最 
后 ， 我 们 应 用 式 (3.1) 得 到 
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ri = Ga + ab(bb) ba 
r=b+ab(bb)'a 
rs=b+a(bb)'ba 

rs = a(bb)'a 





aa + ab{ob) ba pb) 
O+2f25j0a4 () 
b+ablbbla 
图 3-14 
最 终 的 表达 式 又 长 又 复杂 ， 但 是 ， 得 到 它 的 方式 确 是 相对 直接 的 。 口 





3.2.3 描述 简单 模式 的 正则 表达 式 


在 例 1.15 和 2.1 节 的 习题 15 中 ， 我 们 探讨 了 有 穷 接受 器 和 程序 设计 语言 的 简单 组 成 部 分 ， 
如 标识 符 、 整 数 和 实数 之 间 的 关系 。 有 穷 自动 机 和 正则 表达 式 之 间 的 关系 意味 着 我 们 可 以 把 
正则 表达 式 看 成 是 描述 这 些 特 征 的 一 种 方式 。 这 点 很 容易 看 出 来 ， 比 如 ， 所 有 可 以 被 接受 的 
Pascal 整 数 的 集合 用 正则 表达 式 描述 ， 可 以 表示 成 sdd*。 这 里 ，s 表 示 符 号 ， 可 能 的 取 值 范围 
为 {+, ,A}，d 表 示 从 0 到 9 的 数字 。 

Pascal 整 数 是 所 谓 的 “模式 ”的 一 个 简单 例子 。 模 式 指 的 是 具有 共同 属性 的 对 象 集合 。 模 
式 匹 配 指 的 是 把 一 个 给 定 的 对 象 赋值 给 某 几 个 分 类 中 的 一 个 。 成 功 模式 匹配 的 关键 常常 在 于 
找到 一 个 有 效 的 描述 模式 的 方法 。 这 是 计算 机 科学 中 一 个 复杂 并 且 广 阔 的 领域 ， 我 们 在 这 时 
只 能 简单 间接 地 涉及 而 已 。 下 面 是 一 个 简化 但 有 启发 意义 的 例子 ， 它 演示 了 我 们 到 目前 为 止 
探讨 过 的 想法 是 如 何在 模式 匹配 领域 发 挥 作 用 的 。 

例 3.11 模式 匹配 可 以 应 用 于 文本 编辑 。 所 有 的 文本 编辑 器 都 允许 在 文本 中 搜索 某 个 给 定 
的 符号 种。 大 多 数 编辑 器 还 扩展 了 这 项 功能 ， 使 得 它 能 够 搜索 模式 。 例 如 ，UNIX 操 作 系统 中 
的 编辑 器 ed 可 以 识别 命令 

/apa ec/ 


这 条 命令 是 要 在 文档 中 搜索 满足 下 面条 件 的 符号 串 : 符号 串 ab 后 面 跟着 任意 数目 的 4， 之 后 跟 
着 一 个 c。 从 这 个 例子 ， 我 们 可 以 看 出 UNIX 编 辑 器 能 够 识别 正则 表达 式 (尽管 它 有 时 候 使 用 
的 识别 正则 表达 式 的 方式 和 这 里 使 用 的 规则 有 所 不 同 )。 

这 个 领域 具有 挑战 性 的 任务 就 是 写 一 个 有 效 的 程序 来 识别 符号 串 模式 。 在 文档 中 寻找 一 
个 指定 的 符号 串 是 个 非常 简单 的 程序 设计 练习 ， 但 是 这 里 的 情况 更 加 复杂 。 我 们 必须 处 理 无 
限 长 的 任意 复杂 模式 ， 而 且 模 式 不 是 事先 固定 的 ， 是 在 运行 时 产生 的 。 模 式 描述 是 输入 的 一 
部 分 ， 因此， 识别 过 程 必须 要 灵活 。 为 了 解决 这 个 问题 ， 经 常 需要 使 用 自动 机 理论 。 

如 果 模 式 可 以 被 正则 表达 式 识别 出 来 ， 那 么 模式 识别 程序 就 可 以 采用 这 种 描述 方式 ， 


84 
85 
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使 用 定理 3.1 中 的 构造 方法 把 它 转化 成 等 价 的 nfa。 然 后 可 以 使 用 定理 2.2 来 把 它 还 原 成 dfa。 
将 这 个 dfa 写 成 一 个 转移 表格 的 形式 ， 就 成 为 一 个 有 效 的 模式 匹配 算法 。 程 序 员 需要 做 的 仅 
仅 是 使 用 这 个 表格 给 出 一 个 通用 的 框架 。 这 样 ， 我 们 可 以 自动 处 理 在 运行 时 刻 定义 的 大 量 
模式 。 

还 要 考虑 程序 的 效率 。 使 用 定理 2.1 和 定理 3.1， 由 正则 表达 式 构造 有 穷 自 动机 的 过 程 会 产 
生 具 有 很 多 状态 的 自动 机 。 如 果 内 存 空间 有 问题 的 话 ， 就 使 用 2.4 节 中 减少 状态 的 方法 。 ” 口 


习题 


1. 使 用 定理 3.1 的 构造 方法 ， 构 造 接受 语言 CCap'aa + bppa"ap) 的 nfa。 
2. 构造 一 个 nfa， 接 受 习题 1 中 的 语言 的 补 集 。 
3. 设计 -个 接受 语言 L((a + 5)b(a + 5b)") 的 nfa。 芥 
4. 分 别 构造 接受 下 列 语言 的 dfa: 
(a) L(aa' + aba'b") 驶 
(b) L(ab(a + ab)’'(a + aa)) 
(c) L((abab)’ + (aad + b)’) 
(d) L(((aa')'b)’) 
5. 分 别 构 造 接 受 下 列 语言 的 dfa: 
(a) L = Lab'a )UL((ab)’ba) 
(b) L = L(ab’a mb pa) 
6. 为 3.1 节 习题 15(f) 构造 nfa。 使 用 这 个 来 生成 该 语言 的 正则 表达 式 。 
7. 给 出 图 3-9 构 造 过 程 中 ， 当 图 3-9a 中 的 边 逐 条 去 掉 时 ， 使 用 的 构造 规则 。 允 


8. 考虑 下 面 的 通用 转移 图 
a+s 
ab 
“ 妈 


(a) 给 出 一 个 与 之 等 价 的 只 有 两 个 状态 的 通用 转移 图 。 稳 
(b) 这 个 图 接受 的 语言 是 什么 ” 者 
9. 下 面 的 通用 转移 图 接受 的 是 什么 语言 ? 





a a+b a+b 
d a LU a+b 


ab+e 


10. 分 别 给 出 下 列 自动 机 接受 的 语言 的 正则 表达 式 : 
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11. 重 做 例 3.10， 不 过 这 次 我 们 首先 去 掉 状态 OO。 

12. 为 下 面 定 义 在 {a, 5} 上 的 语言 构造 正则 表达 式 : 
(9) 工 ={w :nA(w) 和 ns(w) 都 是 偶数 } 
(bD)L={w: WwW) — nw)mod 3=1} 
(c)L= {w: nw) —n,(w)mod 3¥0} 
(d) 工 = {w : 2no(w) + 3ns(w) 是 偶数 } 

13. 给 出 能 够 生成 2.1 节 习题 23 中 定义 二 进 制 加 法 的 三 元 符号 串 的 正则 表达 式 。 

14. 证 明 图 3-9 的 构造 方法 可 以 生成 等 价 的 通用 转移 图 。 

15. 给 出 描述 Pascal 实 数 集合 的 正则 表达 式 。 

16. 给 出 描述 Pascal 整 数 集合 的 正则 表达 式 。 

17. 很 多 应 用 中 ， 如 : 程序 拼写 检查 ， 我 们 不 需要 进行 模式 的 精确 匹配 ， 只 需要 模糊 匹配 。 一 
旦 模糊 匹配 变 得 精确 了 ， 自 动机 理论 就 可 以 应 用 到 构造 模糊 模式 匹配 机 中 。 比 如 ， 在 原 有 
的 模式 匹配 中 插入 一 个 符号 ， 从 而 获得 的 模式 。 设 L 是 定义 在 > 上 的 正则 语言 ， 定 义 

insert(D) = {uav : aEy, uvEL} 


效果 上 ， 对 于 Z 中 的 每 一 个 单词 ， 在 单词 的 任意 位 置 插入 一 个 伪 字 母 ，izsertZ) 就 包含 这 
样 生成 的 所 有 单词 。 
友 (a) 对 给 定 的 一 个 接受 的 nfa， 说 明 如 何 为 insert(Z) 构造 nfa。 乔 
友 克 (b) 讨论 如 何 使 用 这 个 来 写 一 个 insertZ) 的 模式 识别 程序 ， 把 L 的 正则 [表达 式 作为 输 
入 。 
碌 18. 与 前 面 的 习题 类 似 ， 去 掉 符号 串 中 的 一 个 符号 ， 考 虚 所 有 按照 这 样 的 办 法 由 LL 生成 的 单 
词 。 给 出 语言 的 去 掉 操作 drop 的 形式 化 定义 。 给 定 接受 [的 nfa， 构 造 接受 drop(L) 的 nfa。 
19. 使 用 定理 3.1 的 构造 方法 ， 构造 接受 L(ag) 和 Z(2 ) 的 nfa。 这 个 结果 和 这 些 语言 的 定义 一 致 
贻 ? 
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3.3 正则 文法 


描述 正则 语言 的 第 三 种 方法 是 使 用 某 种 简单 的 文法 。 文 法 经 常用 来 表示 某 个 特定 语言 。 
每 当 我 们 用 自动 机 或 其 他 方式 定义 一 个 语言 族 的 时 候 ， 我 们 都 会 有 兴趣 了解 与 语言 族 相关 联 
的 文法 是 什么 样 的 。 首先 ， 我 们 看 看 能 够 产生 正则 语言 的 文法 。 


3.3.1 右 线性 文法 和 左 线性 文法 


定义 3.3 文法 G = (V,T, 8, P) 称 为 右 线 性 (right-linear) 文法 ， 如 果 所 有 的 产生 式 都 满足 
下 面 的 形式 


A—xB 
A—x 
其 中 ，4, BEV， 并 且 xET"。 所 有 产生 式 满足 如 下 两 种 形式 的 文法 称 为 左 线 性 (left-linear) 文法 
A—Bx 
或 
人 一 > 


右 线 性 文法 和 左 线性 文法 都 是 正则 文法 (regular grammar ) 。 

注意 在 正则 文法 中 ， 任 何 产生 式 的 右 侧 至 多 有 一 个 变量 。 而 且 ， 这 个 变量 要 么 在 产生 式 
的 最 右 端 ， 要 么 在 最 左 端 。 

例 3.12 文法 Gl = ({S}，,{a,p},S,PD)， 按 照 右 线 性 定义 已 如 下 


S—abSla 
文法 G， 三 ({5, S1， $2}, {a, b}, 49， P,), 产生 式 是 左 线性 的 ， 定义 为 
S—Siab 
Si—>Siabl|S, 
2 一 0 
G1 和 G, 都 是 正则 文法 。 
CC 的 推导 得 出 的 推导 序列 
S=>ab$S=>ababS=>ababa 
根据 这 个 简单 例子 ， 容 易 推 测 出 L(G1) 是 正则 表达 式 r = (ab)"a 表 示 的 语言 。 类 似 地 ， 我 们 可 以 
看 出 L(G,) 就 是 正则 语言 L(aab(ab)”)。 口 
例 3.13 文法 G =({5, 4,B}, {a,b},5,P)， 产生 式 
S—A 
A~—>aB|A 
B—Ab 


不 是 正则 的 。 尽 管 每 个 产生 式 要 么 是 右 线 性 形式 ， 要 么 是 左 线 性 形式 ， 但 是 文法 本 身 就 不 是 
右 线 性 的 ， 也 不 是 左 线性 的 。 因此 ， 这 个 文法 不 是 正则 的 。 这 个 文法 是 线性 文法 (linear 
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grammar )。 线 性 文法 指 的 是 在 产生 式 的 右 侧 至 多 有 一 个 变量 的 文法 ， 而 且 不 限制 这 个 变量 的 
位 置 。 很 明显 ， 正 则 文法 总 是 线性 的 ， 但 是 并 不 是 所 有 的 线性 文法 都 是 正则 的 。 口 

我 们 的 下 一 个 目标 是 证 明正 则 文法 和 正则 语言 是 相关 的 ， 对 于 每 种 正则 语言 ， 总 存在 一 
个 表示 它 的 正则 文法 。 因 此 ， 正 则 文法 是 正则 语言 的 另 一 种 表示 方法 。 


3.3.2 右 线性 文法 生成 正则 语言 


首先 ， 我 们 证 明 右 线 性 文法 产生 的 语言 总 是 正则 的 。 为 了 证 明 这 一 点 ， 我 们 要 构造 一 个 
nfa， 让 它 来 模仿 布线 性 文法 的 推导 过 程 。 注 意 右 线性 文法 的 句 型 ， 仅 有 一 个 变量 ， 并 且 这 个 
变量 出 现在 最 右 端 。 假 设 我 们 使 用 产生 式 D 一 dE 得 到 一 个 推导 

ab.……cD=>ab:……cdE 


相应 的 nfa 可 以 模仿 这 个 步骤 。 过 到 符号 4，nfa 从 状态 D 移 动 到 状态 FE。 按照 这 个 方法 ， 自 动机 
中 的 状态 就 对 应 着 句 型 中 的 变量 ， 而 符号 捉 的 前 绿 保 持 不 变 。 上 述 的 这 个 简单 想法 是 下 面 定 
理 的 基础 。 
定理 3.3 设 C = (V,7,5,P) 是 右 线性 文法 。 那么 ，L(G) 是 正则 语言 。 
证 明 : 假设 V= {Vo, Vi,…}， 并且 5S = Vo， 产生 式 的 形式 为 ww 一 mVY， V>VW… 或 WV 一 V,…。 如 
果 w 是 LG) 中 的 一 个 符号 串 ， 那 么 因为 G 中 的 产生 式 的 形式 ， 推 导 一 定 是 按照 下 面 的 形式 进行 
Yo 一 由 用 
=—>viv2V, 


vv pV 


VV VV = w (3-2) 
需要 构造 的 自动 机 将 通过 顺序 地 使 用 这 些 v 来 再 现 这 个 推导 。 自 动机 的 初 态 将 标 为 内 。 对 于 每 
个 变量 V,， 都 将 对 应 地 存在 一 个 标 有 V 的 非 终 态 。 对 于 每 一 个 产生 式 


V>aia2anV, 
自动 机 中 都 存在 - -个 连接 V 和 V 的 转移 。 即 :6 将 被 定义 使 得 
(Vi, aia am) = VY, 
对 于 每 … 个 产生 式 
Valas…a, 
自动 机 中 相应 的 转换 就 是 
(Vi, arayan) = V, 
其 中，V 是 终 态 。 需 要 处 理 的 中 间 状 态 无 关 紧 要 ， 可 以 任意 标记 。 通 用 的 方法 如 图 3-15 所 示 。 
把 这 些 单独 的 部 分 组 装 起 来 就 构成 了 完整 的 自动 机 。 
现在 假设 wEL(G)， 以 便 满足 式 (3-2)。 在 nfa 中 ， 根 据 构造 ， 存 在 从 WV 到 V 标 记 为 v 的 路 
径 ， 从 Vi 到 VY 标 记 为 "的 路 径 ， 等 等 。 因 此 ， 很 明显 就 有 
VE6(Vo, w) 
其 中 w 是 被 M 接 受 的 。 








表示 Vi 一 aiaz…anV 


OO -OO 


表示 Vir>aiaz…an 
3-15 
有 反之， 假设 w 是 被 MM 接受 的 。 因 为 构造 M 的 方式 ， 接 受 w 的 自动 机 必须 经 过 Vo, V;, … 到 Vj 这 
个 状态 序列 和 标记 为 v1, v,, … 的 路 径 。 因 此 ，w 必 须 具 有 形式 
w = VV Vv 
并 且 ， 可 能 得 到 推导 
Vo 一 mV 一 Yi vv VV i 
此 ，w 属 于 L(G)， 定 理 得 以 证 明 。 面 
例 3.14 构造 接受 由 下 面 文法 生成 的 语言 的 有 限 自 动机 : 
Vo—aVi 
Vi—>abVolb 
我 们 先 确定 顶点 Vo, VI, 和 V， 作 为 构造 转移 图 的 开始 。 根 据 第 一 个 产生 规则 ， 在 顶点 VW 和 Vi 之 
间 建 立 标记 为 a 的 边 。 对 于 第 二 条 规则 ， 我 们 要 引入 一 个 附加 的 顶点 ， 使 得 在 顶点 Vi 和 WW 之 间 
存在 一 条 标记 为 ab 的 路 径 。 晤 后 ， 我 们 需要 在 V, 和 Vi 之 间 增 加 一 条 标记 为 5 的 边 ， 得 到 的 自动 
机 如 图 3-16 所 示 。 由 这 个 文法 产生 ， 并 被 自动 机 接受 的 语言 L((aab)"ab) 就 是 正则 语言 。 口 


HOmm Ome 





图 3-16 
3.3.3 正则 语言 的 右 线性 文法 


为 了 证 明 任何 正则 语言 都 可 以 由 某 个 布线 性 文法 生成 ， 我 们 从 语言 的 dfta 出 发 ， 把 定理 3.3 
的 构造 过 程 逆 过 来 。 现 在 ，dfa 的 状态 变 成 了 文法 的 变量 ， 转 移 函 数 中 的 终结 符 变 成 了 产生 式 
中 的 符号 。 

定理 3.4 如果 L 是 定义 在 字母 表 允 上 的 正则 语言 ， 那 么 存在 右 线性 文法 G = (V, >，8， DP), 
使 得 L = L(G)。 
证 明 : 设 M = (8, ,6, go, 下) 是 接受 L 的 dfa。 我 们 假设 0 = {go, q1,…, q;} 和 3 = {a as, …, an}。 
构造 右 线性 文法 G = (VY, ,5, P)， 其 中 
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了 = {40,41,**, 4n} 
并 且 S = go。 对 于 M 中 的 每 个 转移 函数 


(qi, a) = qi 
我 们 把 下 面 的 产生 式 放 入 P 中 
qi agt (3-3) 
另外 ， 如 果 gk 属 于 已 ， 则 向 P 中 增加 产生 式 
qi 和 (3-4) 


我 们 首先 证 明 ， 按 这 种 方式 定义 的 G 能 够 产生 L 中 的 每 个 符号 串 。 已 知 wEL， 并 且 具 有 形式 
Ww = aa 
若 M 接 受 这 个 符号 串 ， 则 它 要 经 过 下 面 的 迁移 
6(go,4;)= 9q, 
6(q,,4))=g, 


6(g,,a:)=q, 
6(q,,a) = gq; EF 
通过 构造 ， 对 于 每 个 5， 文 法 都 有 一 个 相应 的 产生 式 。 因 此 ， 我 们 可 以 用 文法 G 和 wEL(G) 进 
行 推导 
do>adp— Aad aiay “aiMad Aaa a Aa (3-5) 
反之 ， 如 果 wEL(G)， 那 么 它 的 推导 一 定 具 有 式 (3-5) 的 形式 。 这 就 意味 着 
(qu， aaj aa) = dr 
从 而 完成 了 证 明 。 国 
为 了 构造 文法 ， 我 们 需要 注意 把 M 限 制 成 dfa 对 于 证 明定 理 3.4 而 言 不 是 必需 的 。 略 加 修改 
后 ， 如 果 M 是 nfa， 可 以 使 用 同样 的 构造 过 程 。 
例 3.15 ”为 L(aab"a) 构造 右 线 性 文法 。 一 个 nfa 的 转移 函数 和 相应 的 文法 产生 式 在 图 3-17 
中 给 出 。 按 照 定理 3.4 的 构造 方法 可 以 容易 地 得 到 结果 。 按照 构造 的 文法 可 以 推导 出 符号 串 
aaba， 过 程 为 


goaqi=>aaqg,—=>aabg,=>aabag>aaba 口 
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3.3.4 正则 语言 和 正则 文法 的 等 价 性 


前 面 的 两 个 定理 建立 了 正则 语言 和 右 线性 文法 之 间 的 联系 。 下 面 的 定理 建立 了 正则 语言 
和 左 线 性 文法 之 间 的 类 似 关系 。 进 而 证 明了 正则 文法 和 正则 语言 之 间 的 完全 等 价 性 。 

定理 3.5 语言 L 是 正则 的 ， 当 且 仅 当 存 在 一 个 左 线 性 文法 G， 使 得 L = L(G)。 
证 明 : 我 们 只 列 出 证 明 的 主要 思想 。 给 出 一 个 左 线性 文法 的 产生 式 形式 


A—By 
或 
A->y 
我 们 把 G 中 的 每 个 产生 式 分 别 用 下 面 G 的 右 线 性 文法 的 产生 式 代替 
A—>veB 
或 
A—w 


举 几 个 例子 可 以 更 清楚 地 说 明 L(G) = (L(G))*。 接 下 来 ，2.3 节 习题 12 告 诉 我 们 任何 正则 语言 节 
逆 也 是 正则 的 。 因 为 G6 是 右 线性 的 ， 所 以 L(G) 是 正则 的 。 同 样 地 ，(L(G))* 和 L(G) 也 有 同样 的 
结论 。 国 

把 定理 3.4 和 定理 3.5 放 在 一 起 ， 我 们 可 以 得 到 正则 语言 和 正则 文法 的 等 价 性 。 

定理 3.6 语言 L 是 正则 的 ， 当 且 仅 当 存 在 正则 文法 G， 满 足 L = L(G)。 

现在 ， 我们 有 好 几 种 描述 正则 语言 的 方式 了 ， 包 括 dfa、nfa、 正 则 表达 式 和 正则 文法 。 尽 
管 在 有 些 例 子 中 ， 某 种 或 某 几 种 最 适合 ， 但 是 它们 都 是 同样 有 效 的 表示 方法 。 它 们 都 对 正则 
语言 给 出 了 完整 的 无 二 义 性 的 定义 。 可 以 使 用 本 章 中 的 4 个 定理 来 建立 这 些 概念 之 间 的 关系 ， 
如 图 3-18 所 示 。 






正则 表达 式 


正则 文法 


图 3-18 
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正则 语言 与 正 刚 艾 潜 
习题 
1. 构造 dfa 接 受 由 下 面 文法 生成 的 语言 : 
S—>abA 
A—pbaB 
B—>ahlbb 


2. 构造 一 个 能 生成 语言 上 (aa (ap + a) ) 的 正则 文法 。 

3. 为 习题 1 中 的 语言 构造 左 线性 文法 。 

4. 为 下 面 的 语言 构造 左 线性 文法 和 右 线性 文法 : 
L=t{arb":n22,m>3} 独 


5. 为 语言 L((aab"ab)) 构造 右 线性 文法 。 
6. 构造 一 个 正则 文法 ， 使 之 产生 的 语言 定义 在 2 = {a, 5} 上 ， 并 且 这 个 语言 中 的 每 一 个 符号 串 
至 多 有 3 个 a。 
7. 在 定理 3.5 中 ,证 明 L(G) = (L(G)*。 独 
8. 给 出 一 个 直接 从 nfa 获 得 左 线性 文法 的 构造 方法 。 
9. 为 习题 5 中 的 语言 构造 一 个 左 线 性 文法 。 
10. 为 语言 L = {a”b”: n+ 是 偶数 } 构 造 一 个 正则 文法 。 乔 
11. 构造 正则 文法 ， 使 它 可 以 生成 语言 L = {wE{a,p) ; ns(w) + 3m,(w) 是 偶数 }。 
12. 分 别 为 下 列 定义 在 {a, b} 上 的 语言 构造 正则 文法 。 
(a) 工 = {w : ns(w) 和 ns(w) 都 是 偶数 } 项 
(bD)L={w: (nw) -nw))mod 3=1} 
(OL= {w: (nw)— ns(w))mod 3*0} 
(由 工 = {w : ns(w) 一 ns(w) | 是 奇数 } 
13. 证 明 : 对 于 任何 一 种 不 包含 4 的 正则 语言 ， 都 存在 一 个 产生 它 的 右 线性 文法 ， 并 且 产 生 式 
满足 下 面 的 形式 


A—aB 
或 
A—a 
其 中 ，4, BEV 有 HLaET。 
14. 证 明 : 对 于 任意 文法 G， 若 L(G)*B， 则 一 定 至 少 存在 一 个 下 面 形式 的 产生 式 
A—x 


其 中 ，4EV 且 xE7。 

15. 构造 一 个 正则 文法 ， 使 它 生成 所 有 Pascal 实 数 的 集合 。 

16. 设 C, = (Vi, ,$1, Pi) 是 右 线性 文法 ， G2 = (WV, ,52, PP) 是 左 线性 文法 。 假 设 VI 和 V, 不 相交 。 
考察 线性 文法 G = ({S}UVIUV,, ,5, P)， 其 中 ，5 不 属于 ViUV,， 并 且 P = {S—S1|S2}UPUP,. 
证 明 L(G) 是 正则 的 。 大 





第 4 章 正则 语言 的 性 质 


我 们 已 经 定义 了 正则 语言 ， 研 究 了 几 种 表示 正则 语言 的 方法 ， 并 且 通 过 一 些 例子 了 解 了 
它们 的 用 途 。 现 在 提出 一 个 新 的 问题 : 正则 语言 作为 一 种 语言 有 多 通用 呢 ? 是 不 是 所 有 的 形 
式 语 言 都 是 正则 的 ? 或 许 我 们 指定 的 任何 集合 都 可 以 被 某 些 可 能 很 复杂 的 有 穷 自 动机 接受 。 
我 们 不 久 就 会 看 到 ， 这 个 猜测 的 答案 是 否定 的 。 但 是 为 了 便于 理解 为 什么 是 这 样 的 ， 我 们 必 
须 深 入 正则 语言 的 本 质 ， 看 看 整个 语言 族 到 底 有 哪些 性 质 。 

我 们 提出 的 第 一 个 问题 是 ， 如 果 我 们 对 正则 语言 进行 运算 ， 结 果 会 怎么 样 。 这 里 提 到 的 
运算 指 的 是 简单 的 集合 运算 ， 如 连接 ， 以 及 会 使 语言 中 的 每 个 符号 串 都 发 生变 化 的 运算 ， 像 
2.1 节 习题 22 中 的 例子 。 这 样 得 到 的 语言 是 否 仍然 是 正则 的 ?我 们 把 这 个 问题 看 成 是 封闭 性 
(closure) 问题 。 尽 管 大 多 数理 论 都 关注 这 个 性 质 ， 但 是 我 们 对 它 感 兴趣 的 原因 在 于 它 能 够 帮 
助 我 们 区 分 遇 到 的 不 同 语言 族 。 

关于 语言 族 的 第 二 个 问题 讨论 我 们 决定 某 些 性 质 的 能 力 。 例 如 ， 我 们 是 否 能 够 判断 出 一 
种 语言 是 有 穷 的 ， 还 是 无 穷 的 ? 我 们 下 面 会 看 到 ， 这 个 问题 对 于 正则 语言 而 言 是 很 容易 回答 
的 ， 但 是 对 于 别 的 语言 族 而 言 就 不 容易 回答 。 

最 后 ， 我 们 考虑 最 重要 的 问题 : 如 何 判断 某 种 语言 是 否 为 正则 的 ? 如 果 这 种 语言 确实 是 
正则 的 ， 我 们 可 以 通过 给 出 它 的 dfa、 正 则 表达 式 或 正则 文法 来 证 明 。 但 是 如 果 它 不 是 正则 的 ， 
我 们 需要 使 用 其 他 方法 来 说 明 它 不 是 正则 的 。 证 明 一 种 语言 不 是 正则 的 ， 一 种 办 法 是 研究 正 
则 语言 的 一 般 性 质 ， 即 :所 有 正则 语言 都 具有 的 特点 。 如 果 我 们 知道 这 些 性 质 ， 且 能 证 明 候 
选 的 语言 不 具备 某 种 上 述 性 质 ， 那 么 我 们 就 可 以 说 这 种 语言 不 是 正则 的 。 

在 本 章 里 ， 我 们 考察 正则 语言 的 各 种 性 质 。 这 些 性 质 告 诉 我 们 正则 语言 能 够 做 什么 ， 不 
能 够 做 什么 。 以 后 ， 当 我 们 用 这 些 类 似 问 题 考察 其 他 语言 族 时 ， 可 以 使 用 这 些 性 质 的 异同 点 
来 对 照 不 同 的 语言 。 


4.1 正则 语言 的 封闭 性 质 


考虑 下 面 的 问题 : 给 定 正则 语言 L, 和 L,， 它 们 的 并 集 是 否 仍然 是 正则 语言 ? 在 一 些 特殊 的 
例子 中 ， 结 论 是 显而易见 的 。 但 是 这 里 我 们 想 要 强调 的 是 这 个 问题 的 普遍 性 。 对 于 所 有 的 正 
则 语言 志和 乙 ， 它 是 否 都 成 立 ? 事实 证 明 这 个 问题 的 答案 是 肯定 的 ， 于 是 我 们 说 正则 语言 族 在 
并 运算 下 是 封闭 (closed) 的 。 我 们 对 于 语言 的 其 他 运算 可 以 问 类 似 的 问题 ， 这 就 使 得 我 们 要 
从 普遍 意义 上 去 研究 语言 的 封闭 性 质 。 

各 种 语言 族 在 不 同 运算 下 的 封闭 性 具有 一 定 的 理论 研究 价值 。 首 先 ， 我 们 可 能 还 不 清楚 
这 些 性 质 的 实际 意义 。 我 们 必须 承认 某 些 性 质 的 意义 不 大 ， 但 是 很 多 结论 却 是 十 分 有 用 的 。 
封闭 性 质 使 我 们 深入 到 语言 族 的 更 一 般 的 本 质 中 ， 从 而 帮助 我 们 解决 更 多 的 实际 问题 。 本 章 
的 后 面 将 介绍 这 些 例子 (定理 4.7 和 例 4.13 )。 
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4.1.1 简单 集合 运算 的 封闭 性 

我 们 首先 看 看 普通 集合 运算 上 ， 如 并 和 交 ， 正 则 语言 的 封闭 性 。 

定理 4.1 。 如果 上 和 是 正则 语言 ， 那 么 LIULs, LiNL, LiL,， 工 和 Li 也 都 是 正则 的 。 于 是 ， 
我 们 认为 正则 语言 族 在 并 、 交 、 连 接 、 补 和 星 闭 包 上 都 是 封闭 的 。 
证 明 : 如 果 L 和 上, 是 正则 的 ， 那 么 一 定 存在 正则 表达 式 r, 和 r,， 使 得 Li = L(71), L, = L(r,)。 根 据 
定义 ，ri + 72, rtp 和 ri 分 别 是 表示 语言 LUL,，Li 和 的 正则 表达 式 。 因 此 ， 并 、 连 接 和 星 闭 
包 上 都 是 封闭 的 。 

为 了 证 明 补 运算 的 封闭 性 ， 设 接受 L 的 一 个 dfa 为 M = (Q,, 6, go, F)。 那 么 dfa 

M=(Q,2,6,q0,0-F) 

接受 去 。 这 个 结论 是 相当 直接 的 ， 我 们 已 经 在 2.1 节 习题 4 中 提 到 这 个 结论 。 注 意 dfa 的 定义 ， 
我 们 假设 5 是 个 全 函数 ， 因 此 6"(qo, mw) 是 定义 在 所 有 wE3* 上 上 的。 所以， 要么 5(go, w) 是 终 态 ， 
在 这 种 情况 下 ，wEL; 要 么 6'(qgo, w)EQ -下 在 这 种 情况 下 ，w ez。 - 

演示 交 运 算 下 的 封闭 性 要 麻烦 些 。 设 疡 三 L(M'), L, = TL(M,), 其 中 3 M. 三 (@， 二 ， 0， do, Fi) 和 
M, = (P, 区 ,6,,po, FF) 都 是 dfa。 我 们 把 M1, 和 M, 合 并 起 来 构造 出 组 合 自 动机 和 Y= (0, 2,6(g,,p,), 记 )， 
状态 集 为 @ = QxP， 它 的 元 素 为 状态 对 (gq,, p))。 当 MM, 处 于 状态 q;，M; 处 于 状态 p 时 ， 则 转移 函 
数 6 定义 族 位 于 状态 (gi,p;)。 即 : 当 

61(g;, a) = gx 
并 且 . 
6,(p;, a)=p, 
则 有 
6((gi, pi),4) = (gi, p1) 


定义 天 为 所 有 的 (9 站)) 构成 的 集合 ， 其 中 ， gEF', pjEF,. 那么 容易 证 明 : wELNML, 当 上 且 仅 
当 它 被 好 接受 。 因 此 ，ZmZ2 是 正则 的 。 败 

交 运 算 封 闭 性 的 证 明 是 构造 法 证 明 的 一 个 典型 例子 。 不 仅仅 因为 它 构造 出 了 理想 的 结果 ， 
而 且 是 因为 它 清晰 地 给 出 了 如 何 为 两 个 正则 语言 的 交集 构造 有 穷 接受 器 。 构 造 性 证 明 贯 穿 了 
整 本 书 ， 它 很 重要 ， 因 为 它 使 我 们 能 深入 研究 结果 ， 并 且 可 以 作为 研究 实际 算法 的 入 手 点 。 
这 里 有 :一些 短 小 的 、 非 构造 性 的 证 明 (或 者 至 少 不 是 明显 的 构造 性 证 明 )。 为 了 证 明 交 运算 的 
封闭 和 性， 我 们 首先 使 用 德 摩根 定律 ， 对 式 (1-3) 两 边 分 别 取 补 ， 于 是 对 于 任意 语言 LI 和 L， 
都 有 


Nb=LUL 


如 果 二 和 ZL 是 正则 的 ， 那 么 根据 补 运算 的 封闭 性 ， 有 五 和 石 也 是 正则 的 。 使 用 并 运算 的 封闭 
性 ， 我 们 得 到 LU 也 是 正则 的 。 再 次 使 用 补 运算 的 封闭 性 ， 可 以 得 到 


LUbL=LNL, 
是 正则 的 。 
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下 面 的 例子 是 同样 想法 的 一 个 变换 。 

例 4.1 的。 换 句 话说 ， 我 们 要 证 明 : 如 果 忆 和 六 是 正 
则 的 ， 那 么 广场 一定 也 是 正则 的 。 

恨 据 集 公关 过 算 的 定义 可以 立 划 得 到 所 知 的 集 全 等， 即 


n-b=LND 
已 是 正则 的 ， 意 味 着 五 也 是 正则 的 。 然 后 ， 因 为 正则 语言 在 交 运 算 下 的 封闭 性 ， 我 们 可 
以 知道 专门 五 也 是 正则 的 ， 于 是 证 明 完成 了 。 口 


根据 这 些 基本 命题 可 以 推导 出 一 些 其 他 的 封闭 性 质 。 

定理 4.2 正则 语言 族 在 转 置 运算 上 也 是 封闭 的 。 四 
证 明 : 这 个 命题 的 证 明 任务 是 2.3 节 的 一 个 习题 ， 这 里 给 出 一 些 细节 。 假 设 L 是 正则 语言 ， 那 
么 我 们 构造 一 个 只 有 一 个 终 态 的 nfa 接 受 它 。 根 据 2.3 节 习题 7， 这 总 是 可 能 的 。 在 这 个 nfa 的 转 
移 图 中 ， 我 们 把 初 态 的 顶点 作为 终 态 的 顶点 ， 把 终 态 的 顶点 作为 初 态 的 顶点 ， 把 所 有 边 的 方 
向 调转 过 来 。 可 以 很 直观 地 证 明 ， 修 改 后 的 nfa 接 受 w*， 当 且 仅 当 原 来 的 nfa 接 受 w。 因 此 ， 修 
改 的 nfa 接 受 L*， 从 而 证 明了 转 置 运 算 的 封闭 性 。 加 


4.1.2 其 他 运算 的 封闭 性 


除了 语言 的 标准 运算 外 ， 还 可 以 定义 语言 的 其 他 运算 ， 并 研究 这 些 运算 的 封闭 性 。 有 很 
多 这 样 的 研究 结果 ， 这 里 我 们 只 选择 两 个 典型 的 例子 ， 其 他 的 留 作 本 节 的 习题 。 
定义 4.1 假设 了 和 [是 字母 表 。 那 么 函数 
h:y-—I 
称 为 同 态 (homomorphism )。 换 句 话说， 同 态 就 是 把 一 个 字母 用 一 个 符号 串 代 替 。j 画 数 的 定 
义 域 可 按照 某 一 种 明显 的 形式 扩展 成 符号 串 。 如 果 
w = G1G2 peGn 
那么 
h(w) = h(a)h(a2):…h(a,) 
如 果 L 是 定义 在 > 上 的 语言 ， 那 么 它 的 同 态 映像 (homomorphic image) 就 定义 为 
h(L) = {h(w) : wEL} 
例 4.2 已 知 Z = {a,b} 和 T = (a, 5,c)， 定义 为 
h(a)=ab 
h(b) = ppc 
那么 h(aba) = abbbcab。L = {aa, aba} 的 同 态 映像 为 语言 h(L) = {abab， abbbcab}. 口 
如 果 我 们 有 一 种 语言 L 的 正则 表达 式 r， 那 么 对 r 中 的 每 个 > 符号 简单 地 应 用 同 态 ， 就 可 以 
得 到 AZ) 的 正则 表达 式 。 
例 4.3 已 知 Z = {a, 5b} 和 T = {b,c, 分 。 定 义 1 为 
h(a) = dpcc 
h(b) = bbc 
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如 果 Z 是 正则 语言 ， 使 用 正则 表达 式 


r=(a+p)(aah 


表示 ， 那 么 
ri= (dpcc+(bdc) )(dbccdbcc) 


表示 的 是 正则 语言 h(L)。 口 
考察 了 这 个 典型 的 例子 之 后 ， 我 们 将 得 到 正则 语言 在 同 态 运算 上 封闭 的 一 般 结 论 。 
定理 4.3 ” 设 /m 是 同 态 函数 。 如 果 世 是 正则 的 ， 那 么 它 的 同 态 映像 FL) 也 是 正则 的 。 因 此 ， 

正则 语言 族 在 任意 同 态 运算 上 都 是 封闭 的 。 

证 明 : 设 Z 是 用 正则 表达 式 r 表 示 的 正则 语言 。 对 于 r 中 的 每 个 符号 eaEY 对 应 的 ia)， 我 们 都 用 

h(r) 来 替换 。 根 据 正则 表达 式 的 定义 ， 我 们 可 以 直接 证 明 得 到 的 结果 也 是 正则 表达 式 。 很 容 

易 看 出 ， 得 到 的 表达 式 表 示 的 是 AD)。 我 们 需要 证 明 的 仅仅 是 ， 对 于 每 个 wEL(r)， 对 应 的 Mw) 

都 属于 LCh(r))。 相 反 ，、 对 于 LCh(r)) 中 的 每 个 "， 在 ZL 中 都 存在 一 个 w， 使 得 y” = h(w)。 我 们 把 这 

段 证 明 的 细节 留 作 习题 ， 声 明 h(ZL) 是 正则 的 。 因 
定义 4.2。” 设 Li 和 上 ,是 定义 在 同一 个 字母 表 上 的 语言 ， 那 么 LI 和 上 ,的 右 商 (right quotient) 

定义 为 | 

L/L = {xX :XYyELI 对 于 某 个 yEL,} | (4-1) 
为 了 计算 和 的 右 商 ， 我 们 取出 所 有 满足 下 面 要 求 的 符号 早 : L 中 所 有 其 后 组 属于 L, 的 
符号 串 。 由 每 个 这 样 的 符号 串 去 掉 后 缀 后 形成 的 符号 串 都 属于 L/L。 
例 4.4 如 果 
Li={ab"”:n21,m20}Ut{ba} 


L,={b”":m21} 
那么 
ZL = {a'b” :nz21,m>20} 


已 中 的 符号 串 至 少 包 含 -一 个 p。 因 此 ， 我 们 可 以 通过 这 样 的 方法 来 得 到 答案 : 将 已 中 后 缀 至 少 
有 -个 b 的 符号 串 去 掉 一 个 或 多 个 b。 

这 里 注意 L,, 和 LL, 都 是 正则 的 。 这 就 上 暗示 我 们 两 个 正则 语言 的 右 商 也 是 正则 的 。 我 们 
将 在 下 一 个 定理 中 ， 通 过 使 用 ZL, 和 ,的 dfa 构 造 LL, 的 dfa 来 证 明 这 一 点 。 在 我 们 完全 描述 这 个 
构造 过 程 之 前 ， 我 们 先 看 看 下 面 这 个 例子 。 首 先 构 造 接受 LL 的 dfa， 比 如 Mi = (Q, ,6, go, )， 
即 图 4-1 中 的 自动 机 。 因 为 L/L 的 自动 机 必须 接受 Li 中 的 任何 前 级 ， 所 以 我 们 修改 M,， 以 便于 
如 果 y 满 足 图 4-1，M, 就 接受 x。 

困难 在 于 确定 是 否 存在 某 一 个 y， 使 得 xyELi、 并且 yEL,。 为 了 解决 这 个 困难 ,我 们 要 确定 ， 
对 于 任意 一 个 4EQ， 是 否 存 在 一 条 从 g 到 某 个 终 态 的 标记 为 v 的 通道 ， 其 中 v 满 足 vEL,。 如 果 存 
在 的 话 ， 任 何 满足 go, x) = gq 的 x， 都 将 属于 Li/L,。 我 们 相应 地 修改 自动 机 ， 使 q 成 为 终 态 。 

为 了 把 这 点 应 用 到 我 们 的 例子 中 去 ， 我 们 逐个 检查 状态 go, q1, 9;, 9;, qi, 9;， 判 断 是 否 存 在 
一 条 到 9, 9, 或 q4 的 通道 ， 其 标记 为 bb*。 我 们 发 现 只 有 g, 和 gq, 满足 条 件 ， 而 go, gj, qs 不 满足 条 件 。 





正 列 语言 的 性 习 73 


最 终 得 到 的 接受 Li/L, 的 自动 机 如 图 4-2 所 示 。 通 过 对 该 自动 机 进行 检查 可 看 出 ， 这 个 构造 方法 
是 可 行 的 。 这 个 想法 在 下 一 个 定理 中 将 得 到 推广 。 器 








图 4-2 


定理 4.4 ”如 果 Li 和 六 是 正则 语言 ， 那 么 LI/7L2 也 是 正则 的 。 于 是 我 们 称 正 则 语言 族 与 正则 
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语言 在 右 商 运算 上 是 封闭 的 。 ' 
证 明 : 设 L, = L(M)， 其 中 MM = (2, ,5, go, FF) 是 dfa。 我 们 按照 下 面 的 方法 构造 另 一 个 dfa MY = 
(Q, ,6, qo, 户 )。 对 于 每 个 9EQ， 判 断 是 否 存 在 一 个 yYEL,， 使 得 
6°(qgi, y) = qfEF 
这 个 是 否 存 在 的 判断 可 以 通过 考察 另 一 个 dfa M, = (OQ, 5, 6, qd, F) 来 进行 。 自 动机 MM 是 把 M 中 
的 初 态 qo 由 4; 代 赫 。 现 在 我 们 判断 是 否 存在 一 个 >， 既 属于 L(M,)， 又 属于 L,。 为 了 解决 这 个 问 
题 ， 我 们 使 用 定理 4.1 中 两 个 正则 语言 交集 的 构造 方法 ， 构 造 L,NL(M) 的 转移 图 。 如 果 在 初 态 
和 任何 终 态 之 间 存 在 -条 路 径 ， 那 么 L,NL(CM) 就 非 空 。 在 这 种 情况 下 ， 把 q; 加 到 户 中 。 对 于 
任意 qEC， 重 复 这 一 过 程 ， 从 而 确定 六 ， 构 造 故 。 
为 了 证 明 L( YY) = L/L;， 我 们 假设 x 是 LL 中 的 任意 元 素 。 那 么 一 定 存在 着 一 个 yEL,，、 使 
得 xyEL1。 这 就 意味 着 
6'(qo, XY)EF 
因此 ， 一 定 存在 某 个 geQ@， 使 得 
6'(go, x)= 4 
并 且 
6'(g, y)EF 
因此 ， 根 据 构造 可 知 gEF， 并 且 让 接受 r， 因 为 ，5'(qo,x) 属于 育 。 
相反 ， 对 于 及 接受 的 任意 x， 我 们 都 有 
6'(go, x) = g EF 
但 是 根据 构造 法 ， 我 们 得 到 一 定 存在 一 个 yEL,， 满 足 6(qo, y)EF。 因 此 ，xy 属 于 L1， 并 且 x 属 
于 L/L,。 我 们 于 是 得 到 结论 
LM)=L/L, 
由 此 可 知 ，Li/L, 是 正则 的 。 国 
例 4.5 构造 L/L,， 已 知 
Li=L(a'baa’) 
L, = L(ap’) 
我 们 首先 找到 接受 L 的 dfa。 这 个 容易 ， 图 4-3 给 出 了 一 种 解 。 这 个 例子 很 简单 ， 所 以 我 们 可 以 
跳 过 构造 的 过 程 。 根 据 图 4-3， 显 然 有 
LUMomnz2 = 人 
LAM)NL, = {a} #9 
LAM)NL,= {a} 好 
LM)INDL, = 
因此 ， 确 定 了 接受 LL, 的 自动 机 ， 结 果 如 图 4-4。 这 个 自动 机 接受 由 正则 表达 式 a'b + a'baa' 表 
示 的 语言 ， 这 个 正则 表达 式 可 以 简化 成 a'ba'。 因 此 L/L = L(a'ba”)。 口 
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习题 


ka 一 


LU 


wn 人 


人 


vv 


oo 


9. 


. 完成 定理 4.1 中 交 运 算 封闭 性 的 构造 性 证 明 的 细节 。 
. 使 用 定理 4.1 中 的 构造 方法 来 分 别 构造 接受 下 面 语言 的 nfa。 


(a) L((a + Dja Lbaa') 贡 
(b) L(ab’a NL(a'b'a) 


.在 例 4.1 中 ， 我 们 证 明了 正则 语言 差 运 算 的 封闭 性 ， 但 是 证 明 方法 不 是 构造 性 的 。 提供 一 个 


构造 性 的 证 明 。 


.在 定理 4.3 中 ， 证 明 h(7) 是 正则 表达 式 。 然 后 证 明 A(r) 表示 的 是 A(L)。 
. 证 明正 则 语言 族 在 有 穷 并 运算 和 有 穷 交 运算 上 是 封闭 的 。 即 : 如 果 工 , L,…, 工 ,是 正则 的 ， 


那么 


Ur 和 4= (ls 


i={],2,.…,.n} i={1,2,- 


都 是 正则 的 。 


. 两 个 集合 S, 和 5, 的 对 称 差 (symmetric difference ) 定义 如 下 : 


S$S1© 5, = {xX: XES1 或 者 XES,， 但 是 x 不 同时 存在 于 S, 和 5S; 中 } 
证 明 : 正则 语言 族 在 对 称 差 运 算 上 是 封闭 的 。 


. 两 个 语言 的 nor 定 义 为 


nor(Li, 1L,)= {w: wlL 并 Hw¢L,} 
证 明 : 正则 语言 族 在 运算 nor 上 是 封闭 的 。 龙 


. 两 个 语言 的 补 或 cor 运 算 定义 为 


cor(Li, 上 ) = {w : mE 天 或 者 wE 匹 } 


证 明 : 正则 语言 族 在 cor 运 算 下 是 封闭 的 。 
下 面 的 结论 对 于 所 有 的 正则 语言 和 同 态 都 成 立 吗 ? 








O 
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(a) ACLUL,) = 有 LIDUARCC2) 

(b) ACLMNL,) = CDmRCL2) 

(c) h(LiL,) = h(Li)h(L,) 
10. 已 知 = La baca ) 和 L, = L(aba")， 构 造 Li/L,。 
11. 证明: 对 于 所 有 语言 L, 和 L,， 都 有 Li = LL 成 立 。 
去 12. 假设 我 们 已 知 二 UL 是 正则 的 ， 忆 是 有 穷 的 。 我 们 可 以 由 此 推断 已 是 正则 的 吗 ? 参 
13. 如 果 Z 是 正则 语言 ， 证 明志 = {wuv : wEL, | = 2} 也 是 正则 的 。 
14. 如 果 Z 是 正则 语言 ， 证 明 语言 {wv : uEL, vEL} 也 是 正则 的 。 物 
15. 工 相对 于 L, 的 左 商定 义 为 

LL = {y :xEL,, xXyEL,} 


证 明 : 正则 语言 族 在 左 商 上 是 封闭 的 。 


16. 证 明 : 如 果 命题 “如 果 六 和 PiUL2: 是 正则 的 ， 那 么 己 一 定 也 是 正则 的 ”对 于 所 有 的 乙 和 忆 是 


正确 的 ， 那 么 所 有 的 语言 都 是 正则 的 。 省 
17. 语言 的 尾 (tail) 定义 为 符号 串 所 有 后 组 的 集合 ， 即 : 
iaitD) = {y : 对 于 某 个 xE5", xyEL} 
证 明 : 如 果 Z 是 正则 的 ， 那 么 tei(ZD) 也 是 正则 的 。 
18. 语 言 的 头 (head) 定义 为 符号 串 所 有 前 组 构成 的 集合 。 即 : 
pead(L) = {x : 对 于 某 个 yE2 ,xzyEZ} 
证 明 : 正则 语言 族 在 这 个 运算 下 是 封闭 的 。 尖 
19. 定义 语言 和 符号 串 的 运算 third 如 下 
third(aiayasasdsae**) = asae** 
这 个 定义 的 定义 域 可 以 扩展 到 整个 语言 范围 。 证 明正 则 语言 族 在 这 个 运算 下 是 封闭 的 。 
. 04…a) 为 任意 符号 串 ， 定 义 移 位 【shift) 运算 如 下 
shifi(aias**a,) = qs***anal 
由 此 ， 我 们 可 以 定义 一 个 语言 上 的 运算 如 下 
Shift(L) = {v : 对 于 某 个 wEL,v = shifr(w)} 
证 明正 则 性 在 shi# 下 是 封闭 的 。 
21. 定义 符号 串 和 语言 上 的 运算 交换 (exchange ) 分 别 为 


EXCpa118e(0102 p_iGn) = 0002…G _ 141 


2 


OO 


和 
exchange(L) = {v : 对 于 所 有 wEL,v = exchange(w)} 


证 明正 则 语言 族 在 exchange 下 是 封闭 的 。 
让 22. 两 个 语言 L 和 上 ,的 运算 shuffte 定 义 为 


shuffle(L,, L,) 三 人 VIP2y2 "Win Vm : 对 于 所 有 wi， vi EES,, wiw2' "WnEL, 7IV2 "VnEL,} 
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证 明 : 正则 语言 在 shuffie 运 算 下 是 封闭 的 。 
碌 23. 把 语言 L 上 的 运算 minus5 定 义 为 : 把 L 所 有 符号 串 中 左面 起 第 5 个 符号 去 掉 获 得 的 符号 串 
的 集合 (长 度 小 于 5 的 符号 串 保持 不 变 )。 证 明 : 正则 语言 族 在 这 个 运算 上 是 封闭 的 。 
克 24. 定义 在 L 上 的 左边 (leftside ) 运算 为 
leftiside(L) = {w : wwrEL} 


正则 语言 族 在 这 个 运算 上 是 否 是 封闭 的 ? 
25. 语言 的 min 运 算 定义 为 
min(Z) = {wEL : 不 存在 wuEL, vE2+, 使 得 w = uv} 
证 明正 则 语言 族 在 min 运 算 上 是 封闭 的 。 
26. 设 G, 和 Gs, 是 两 个 正则 文法 。 如 何 从 这 两 个 文法 给 出 下 列 语言 的 正则 文法 : 
(a) L(G)UL(G,) 负 
(b) L(G)L(G») @ 
(c) L(G1) 名 


4.2 正则 语言 的 基本 问题 


现在 我 们 来 看 一 个 很 基本 的 问题 : 给 定语 言 L 和 符号 串 w， 我 们 是 否 能 够 判断 % 是 不 是 Z 的 
元 素 ? 这 是 一 个 成 员 资格 (membership) 问题 ， 解 决 这 一 问题 的 方法 称 为 成 员 资格 算法 。 我 
们 对 这 个 问题 无 能 为 力 ， 因 为 找 不 到 有 效 的 成 员 资格 算法 来 解决 语言 问题 。 我 们 将 在 后 续 的 
讨论 中 关注 这 个 问题 和 成 员 资格 算法 的 本 质 。 这 通常 是 一 个 难题 。 但 是 对 于 正则 语言 而 言 ， 
就 比较 容易 。 

首先 考虑 当 我 们 说 “给 定语 言 ……” 时 ， 我 们 到 底 是 什么 意思 。 在 很 多 命题 中 ， 这 点 很 
重要 ， 这 样 才能 够 意思 明确 。 我 们 有 几 种 方式 来 描述 正则 语言 : 非 形式 化 口头 描述 、 集 合 表 
示 、 有 穷 自动 机 、 正 则 表达 式 和 正则 文法 。 只 有 后 三 项 是 充分 定义 的 ， 并 在 定理 中 使 用 过 的 。 
因此 ， 我 们 说 一 个 正则 语言 是 以 标准 表示 法 (standard representation) 给 定 的 ， 当 且 仅 当 它 是 
被 有 穷 自 动机 、 正 则 表达 式 或 正则 文法 表示 的 。 ， 

定理 4.5 给 定 一 种 标准 表示 法 ， 表 示 任 何 定 义 在 上 的 正则 语言 L 和 任何 wEF*。 这 种 标 
准 表 示 法 都 有 判断 w 是 否 属于 上 的 算法 。 
证 明 : 我 们 用 某 个 dfa 表 示 这 个 语言 ， 然 后 测试 w 看 它 是 否 能 够 被 自动 机 接受 。 国 

另 一 个 重要 的 问题 是 … 个 语言 是 有 穷 的 ， 还 是 无 穷 的 ; 两 个 语言 是 否 相同 ; 一 个 语言 是 
否 是 另 一 个 语言 的 子 集 。 至 少 对 于 正则 语言 而 言 ， 这 几 个 问题 都 容易 回答 。 

定理 4.6 ”对 于 使 用 标准 表示 法 给 出 的 任何 一 个 正则 语言 ， 都 存在 算法 可 以 判断 这 个 语言 
证 明 : 如 果 我 们 用 dfa 的 转移 图 表示 这 种 语言 ， 结 论 是 显而易见 的 。 如 果 从 初 态 顶 点 到 任何 一 
个 终 态 顶点 之 间 存 在 一 条 简单 路 径 ， 那 么 这 个 语言 就 是 非 空 的 。 

为 了 判断 语言 是 否 是 无 穷 的 ， 先 找到 构成 某 个 回路 的 所 有 顶点 。 如 果 这 些 顶 点 中 的 任何 一 
个 位 于 从 初 态 顶点 到 终 态 顶点 的 路 径 上 ， 那 么 语言 就 是 无 穷 的。 否则 ， 语 言 就 是 有 穷 的 。 国 

两 个 语言 的 等 价 问 题 也 是 一 个 很 重要 的 常用 问题 。 一 个 语言 通常 有 几 种 定义 方式 ， 我 们 
需要 知道 的 是 ， 尽 管 它们 的 外 在 形式 不 同 ， 但 它们 表达 的 是 否 是 同一 个 语言 。 这 通常 是 一 个 
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难题 。 即 使 对 于 正则 语言 ， 这 个 命题 的 结论 也 不 是 明显 的 。 我 们 不 可 能 用 逐 名 比较 来 证 明 ， 
因为 这 种 办 法 只 适用 于 有 穷 语言 。 即 便 使 用 正则 表达 式 、 文 法 或 者 dfa， 也 是 不 容易 看 到 结论 
的 。 一 个 比较 合适 的 解决 方法 是 使 用 已 有 的 封闭 性 质 。 

定理 4.7 对 使 用 标准 表示 法 给 定 的 任意 两 个 正则 语言 1 和 L,， 总 存在 判断 L1 = 是 否 成 主 
的 算法 。 
证 阴 : 使 用 LL 和 LL,， 我 们 定义 语言 

b=(LNI)U(LND) 

根据 封闭 性 质 ，Ls 是 正则 的 ， 因 此 我 们 构造 dfaM 接 受 L,。 一 旦 我 们 有 了 M， 我 们 就 可 以 使 用 定 
理 4.6 中 的 算法 来 判断 [是 否 为 空 。 但 是 根据 1.1 节 习题 8， 我 们 知道 ，L; = 纪 当 且 仅 当 记 = 到 。 国 

这 些 都 是 基本 却 显然 的 结论 。 对 于 正则 语言 ， 定 理 4.5 到 定理 4.7 提 出 的 问题 可 以 轻松 地 回 
答 ， 但 是 当 我 们 处 理 更 大 的 语言 族 时 ， 就 不 那么 容易 了 。 后 面 ， 我 们 将 会 碰 到 几 个 类 似 的 问 
题 。 我 们 唯一 可 以 预料 到 的 是 ， 问 题 会 越 来 越 难 回答 ， 甚 至 可 能 根本 没 法 回答 。 


习题 


本 节 的 所 有 习题 都 假设 给 定 的 正则 语言 使 用 标准 表示 法 。 
证 明 : 对 于 任意 w， 任 意 正则 语言 L,: 和 L,， 都 存在 判断 wEL, - 工 是 否 成 立 的 算法 。 志 
证 明 : 对 于 任意 正则 语言 L, 和 L,， 都 存在 判断 LC 工 是 否 成 立 的 算法 。 迄 
证 明 : 对 于 任意 正则 语言 上 ， 都 存在 判断 MEZ 是 否 成 立 的 算法 。 
证 明 : 对 于 任意 正则 语言 L, 和 L,， 都 存在 算法 判断 Li = L/L 是 否 成 立 。 
如 果 L = L*， 我 们 称 这 个 语言 是 回 文 (palindrome ) 语言 。 构 造 一 个 算法 判断 一 个 给 定 的 正 
则 语言 是 否 是 回 文 语言 。 物 
给 出 一 个 算法 ， 用 来 判断 正则 语言 L 是 否 包含 任意 符号 申 w， 满 足 w*EL，。 
已 知 三 个 正则 语言 L, Li, Ly， 给 出 一 个 判断 上 = LL 是 否 成 立 的 算法 。 
给 定 任意 正则 语言 L， 给 出 一 个 判断 L = 是 否 成 立 的 算法 。 
设 L 是 定义 在 > 上 的 正则 语言 ，% 是 >* 中 的 任意 符号 捉 。 给 出 一 个 算法 判断 LL 是否 包含 w， 满 
足 如 是 它 的 子 串 。 即 满足 w = wwv ， 其 中 u,vEY '。 
10. 证 明 : 对 于 任意 正则 语言 L， 都 存在 判断 L = shuffle(L, 六 是 否 成 立 的 算法 。 
11. 运算 tail(L) 定义 为 


wm 


oa 


tail(L) = {y : uwvEL, u, vETD'} 
证 明 对 于 任意 正则 语言 L， 都 存在 判断 L = tail(L) 是 否 成 立 的 算法 。 
12. 设 L 是 定义 在 > = {a, b} 上 的 正则 语言 。 证 明 : 存在 判断 ZL 包括 所 有 长 度 为 偶数 的 符号 串 是 
否 成 立 的 算法 。 移 
13. 构造 一 个 算法 ， 判 断 正则 语言 L 是 否 包含 长 度 为 偶数 的 无 穷 长 的 符号 串 。 
14. 给 出 一 个 算法 ， 判 断 给 定 一 个 正则 文法 G，L(G) = * 是 否 成 立 。 


4.3 识别 非 正则 语言 
从 我 们 举 的 大 多 数 例子 中 ， 可 以 看 出 正则 语言 是 无 穷 的 。 事 实 上 正则 语言 和 具有 有 穷 存 
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储 器 的 自动 机 有 关 ， 但 是 在 正则 语言 结构 上 做 了 一 定 的 限制 。 如 果 想 保证 正则 性 ， 就 一 定 要 
遵循 一 些 限制 。 直 觉 告 诉 我 们 ， 只 有 在 处 理 符号 串 的 过 程 中 ， 每 个 阶段 记录 的 信息 都 要 严格 
限制 ， 这 样 得 到 的 语言 才 是 正则 的 。 这 种 想法 是 正确 的 ， 但 是 ， 这 个 想法 应 该 用 更 有 意义 的 
方式 来 准确 证 明 ， 可 以 用 有 种 方式 来 获得 这 种 准确 性 。 


4.3.1 使 用 使 梨 原 理 


术语 “ 鲍 蘑 原理 ”用 于 数学 领域 ， 主 要 内 容 如 下 。 如 果 我 们 把 a 个 物品 放 到 m 个 盒子 ( 铝 
全) 中 ， 并 且 n>m， 那 么 至 少 有 一 个 盒子 里 装 了 一 个 以 上 的 物品 。 这 是 一 个 明显 的 事实 ,但 
是 根据 这 个 事实 ， 我 们 可 以 得 到 更 多 深刻 的 结论 。 

例 4.6 语言 L = {a"b" : n>0} 是 正则 的 吗 ? 答案 是 否定 的 ， 我 们 将 通过 反 证 法 证 明 答案 。 


假设 L 是 正则 的 。 那 么 ， 一 定 存在 接受 它 的 某 个 dfa M = (@, {a, b}, 5, qo, F)。 对 于 i = 1, 2， 


3,…， 考 察 6 (go, a ))。 因 为 有 无 穷 个 :， 但 是 M 中 的 状态 数 是 有 穷 的 ， 饮 集 原理 告诉 我 们 一 定 存 
在 某 个 状态 ， 设 为 9， 满 足 

6'(qo, 4a")=g 
和 

6(qo,a")=4g 
其 中 ，nx*m。 但 是 因为 MM 接受 a*bp"”， 所 以 我 们 有 

6°(g,b") = gyEF 
因此 ， 我 们 可 以 得 出 

6'(qgo, ab = 6°(6°(go, a”), b") 


= 6'(g,b") 

一 qr 
这 就 和 最 初 的 假设 一 一 只 有 当 n = m 时 ，M 接 受 a"b" 一 - 蔬 盾 。 因 此 ， 我 们 得 到 结论 不 可 能 是 
正则 的 。 口 


在 上 面 的 论证 中 ， 镶 集 原 理 只 是 我 们 准确 阐明 问题 的 一 种 方法 。 通 过 它 ， 我 们 阅 明 了 有 
穷 自动 机 具有 有 穷 存 储 器 意味 着 什么 。 为 了 接受 所 有 的 a"b"， 自 动机 需要 区 别 所 有 的 前 级 a" 和 
4"。 但 是 因为 自动 机 只 有 有 穷 个 内 部 状态 ， 一 定 存在 一 些 a 和 mm， 不 能 够 区 别 。 

为 了 在 不 同 的 情况 下 使 用 上 述 结论 ， 我 们 把 它 整 理 成 有 普遍 意义 的 定理 。 表 现形 式 有 几 
种 ， 我 们 只 给 出 最 著名 的 一 种 。 


4.3.2 泵 引 理 


下 面 的 结论 ， 是 另 一 种 形式 的 铝 售 原理 ， 一 般 称 为 正则 语言 的 夺 引 理 (pumping lemma ) 。 
它 的 证 明 是 基于 具有 n 个 顶点 的 转移 图 ， 任 何 长 度 不 少 于 n 的 通道 一 定 重复 了 菜 个 顶点 ， 即 : 
存在 回路 。 

定理 4.8 设 L 是 无 穷 的 正则 语言 。 那 么 一 定 存在 某 个 正 整 数 m， 满 足 ， 任 意 wEL, |w|>m， 
可 以 分 解 成 


W = xXyz 
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其 中 
bolsm 
中 > 1 
对 于 所 有 i = 0, 1,2, …， 满 足 
Wi = Xy'Z (4-2) 


也 ,属于 了 。 

为 了 释义 这 一 点 ，Z 中 每 个 足够 长 的 符号 串 都 要 拆 分 成 3 部 分 ， 任 章 重复 中 间 部 分 ， 形 成 了 
[的 另 一 个 符号 串 。 我 们 称 中 间 的 符号 串 为 “被 抽出 ”， 因 此 ， 这 个 结论 称 为 泵 引 理 。 
证 明 : 如 果 Z 是 正则 语言 ， 那 么 一 定 存 在 一 个 dfa 识 别 它 。 设 这 个 dfa 的 状态 分 别 标 有 go, gq1, 9;, …， 
au。 现 在 我 们 取 Z 中 的 任意 符号 串 w， 满 足 lw| >m = n + 1。 因 为 假设 Z 是 无 穷 的 ， 所 以 一 定 可 以 
这 样 做 。 考 虑 自动 机 处 理 w 时 ， 经 过 的 状态 集合 ， 比 如 

do 4 qj), ""*, df 
因为 这 个 序列 共有 |w| + 1 项 ， 所 以 至 少 有 一 个 状态 会 被 重复 ， 并 且 这 个 重复 的 发 生 一 定 不 晚 
于 第 n 次 移动 。 因 此 ， 这 个 序列 应 该 形 如 

qo, gi, 1 ,4r, ,dr,,""'， qr 

这 就 意味 着 一 定 存在 w 的 子 串 x, y, z， 满 足 

6'(qo, +) = g, 

0’(g,, y) = g, 

6"(g,, z) = gy 
其 中 |xy| < n+ 1=m,|y|> 1。 由 此 ， 我 们 可 以 立刻 得 到 

6 (quo xz) = qs 
和 

6 (4q。， Xy’z) = ds 

6'(go, Wy 2) = gy 
等 等 。 从 而 完成 了 定理 的 证 明 。 侠 

我 们 只 给 出 无 穷 语言 的 泵 引 理 。 尽 管 有 穷 语 言 也 是 正则 语言 ， 但 是 因为 泵 自动 生成 无 穷 
集合 ， 所 以 不 能 按照 上 面 这 样 抽出 相应 的 符号 串 。 这 个 定理 对 于 有 穷 语 言 依 然 成 立 ， 但 是 没 
什么 意义 。 和 泵 引 理 中 的 mm 要 比 最 长 的 符号 串 的 长 度 还 大 ， 所 以 不 能 够 抽出 符号 串 。 

同 例 4.6 中 的 铝 集 原理 类 似 ， 泵 引 理 可 以 用 于 证 明 某 种 语言 不 是 正则 的 。 证明 也 是 使 用 反 
证 法 。 正 如 我 们 曾 述 的 ， 砂 引 理 不 能 用 于 证 明 一 种 语言 是 正则 的 。 即 使 我 们 能 证 明 (通常 很 
困难 ) 被 抽出 的 符号 串 仍然 属于 原 语 言 ， 但 是 在 定理 4.8 中 ， 我 们 找 不 到 得 出 这 种 语言 是 正则 
的 依据 。 

例 4.7 ”使 用 泵 引 理 证 明 L = {wrz" : n>0} 不 是 正则 的 。 假 设 L 是 正则 的 ， 那 么 泵 引 理 一 定 
成 立 。 我 们 不 知道 m 的 值 ， 但 是 不 论 它 取 什么 值 ， 我 们 都 可 以 取 n = m。 因 此 ， 子 串 y 一 定 仅 包 
含 a。 假 设 |y| = 上。 那么 ， 根 据 式 (4-2) 使 i = 0 获得 的 符号 串 就 是 
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wo = a” ‘pb” 

显然 ， 这 个 符号 串 不 属于 L。 这 与 泵 引 理 了 矛盾。 因此， 假设 不 成 立 ，L 不 是 正则 的 。 口 

在 应 用 泵 引 理 时 ， 我 们 必须 记 住 定理 的 内 容 。 定 理 给 我 们 的 保证 是 : 存在 m， 且 可 以 分 解 
成 xyz 的 形式 ， 但 是 我 们 不 知道 它们 具体 是 什么 。 我 们 不 能 仅仅 因为 m 或 xyz 的 某 个 特殊 值 使 得 
泵 引 理 不 成 立 就 说 矛盾 。 另 外 ， 泵 引 理 对 每 个 wEL 和 i 都 成 立 。 因 此 ， 即 便 有 一 个 w 或 ;使 得 泵 
引 理 不 成 立 ， 这 种 语言 都 不 是 正则 的 。 

正确 的 证 明 过 程 可 以 看 成 是 我 们 和 对 手 玩 一 个 游戏 。 我 们 的 目的 是 要 通过 确定 和 泵 引 理 的 
矛盾 来 赢得 比赛 ， 而 对 手 是 要 阻挡 我 们 。 游 戏 共 有 四 步 。 

1. 对 手 选 一 个 m。 

2. 对 给 定 的 m， 我 们 在 L 中 找 出 一 个 长 度 不 小 于 m 的 符号 电 w。 我 们 可 以 任意 挑 w， 只 要 满 
足 wEL 并 且 |wj> m。 

3. 对 手 选 择 一 种 分 解 方式 ， 分 解 成 xyz， 要 求 |xy| < m，|y| > 1。 我 们 必须 假设 对 手 做 出 的 
选择 一 定 最 不 利于 我 们 赢得 比赛 。 


4. 我 们 使 用 某 种 方式 挑选 一 个 ;， 使 得 被 抽出 的 符号 串 w， 根 据 式 (4-2)， 不 属于 L。 如 果 


我 们 可 以 完成 这 一 步 ， 那 么 我 们 就 赢 了 。 
无 论 对 手 的 选择 是 什么 我 们 都 可 以 获胜 的 方法 等 价 于 证 明 语言 不 是 正则 的 。 这 里 ， 第 2 步 
”是 关键 。 尽 管 我 们 不 可 以 对 对 手 分 解 w 的 方式 作 要 求 ， 但 是 我 们 可 以 选择 w， 使 对 手 在 第 3 步 


受到 限制 ，*, y 和 z 的 选择 会 使 得 我 们 在 下 一 步 推出 违反 泵 引 理 的 结论 。 和 
例 4.8 设 2 = {a,5}。 证 明 L = {ww : wE5'} 不 是 正则 的 。 a-ab..bb..ba..a 
不 论 对 手 在 第 1 步 选择 什么 样 的 m， 我 们 都 能 够 选择 如 图 4-5 所 示 的 w。 *7 z 

再 加 上 要 求 |lxy| < m， 所 以 对 手 在 第 3 步 受 到 限制 的 选择 y 只 能 包含 字母 a。 图 4-5 


第 4 步 , 我 们 令 i = 0。 这 样 获得 的 符号 串 左 侧 比 右 侧 多 了 几 个 a， 因 此， 就 不 具备 wws 的 形式 了 。 
所 以 ，Z 不 是 正则 的 。 

注意 如 果 我 们 选择 的 w 太 短 ， 那 么 对 手 就 会 选 出 具有 偶数 个 5 的 y。 这 样 ， 我 们 在 最 后 一 步 
就 不 能 推出 和 泵 引 理 矛盾 的 结论 了 。 如 果 我 们 选择 全 部 由 a 构成 的 符号 曲 ， 比 如 w = wm， 它 属 
十 L。 这 样 也 无 法 推出 和 和 泵 引 理 矛盾 的 结论 。 因 为 ,为 了 打败 我 们 ， 对 手 只 需 选 出 y = aa， 这 
样 对 于 所 有 的 i:，w, 都 属于 L。 我 们 就 输 了 。 

为 了 应 用 泵 引 理 ， 我 们 不 可 以 假设 对 手 会 犯错 误 。 比 如 ， 如 果 我 们 选择 w = oz， 对手 会 
选择 y = 5， 然后 选择 长 度 为 奇数 的 符号 串 we， 因 此， 得 到 的 符号 串 不 属于 大。 但 是 任何 假设 对 
手 会 如 此 配合 我 们 的 证 明 都 是 不 正确 的 。 器 

例 4.9 设 7 = {a,b}。 语 言 L = {wE2 :nw)<n,(w)} 不 是 正则 的 。 

假设 我 们 给 定 m。 因 为 我 们 有 完全 的 自由 选择 ， 所 以 我 们 选择 w = a"b"*!。 现 在 ， 因 为 Ixy| 
不 可 能 比 m 大 ， 所 以 对 手 只 能 选 出 一 个 全 部 由 a 构成 的 y。 即 : 


y=a',1&k<m 
我 们 现在 泵 出 ， 令 i = 2， 得 到 的 符号 串 是 
w= a"*tp"+! 


不 属于 L。 因 此 ， 违 反 泵 引 理 ，L 不 是 正则 的 。 - 口 


oo 
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例 4.10 语言 L = {(ab)"a* : n>k,k>20} 不 是 正则 的 。 
给 定 m， 我 们 定义 符号 串 为 
w= (ab)”"!!a m 


属于 L。 因 为 约束 |xy| < m， 所 以 x 和 y 都 必须 是 由 ab 构 成 的 符号 串 中 的 一 部 分 。x 的 选择 不 影响 
证 明 ， 因 此 ， 我 们 考 虚 y 的 选择 。 如 果 我 们 的 对 手 选 择 y = a， 我 们 就 选择 i = 0， 从 而 获得 一 个 
不 属于 L((ab)'a') 的 符号 串 。 如 果 对 手 选择 y = ab， 我 们 就 还 选择 i = 0。 这 时 得 到 (ab)"a”"， 它 
仍然 不 属于 L。 同 样 ， 我 们 可 以 处 理 对 手 的 所 有 可 能 选择 ， 从 而 证 明 我 们 的 断言 口 
例 4.11 证 明 = {a” :n>0} 不 是 正则 的 。 
给 定 对 手 选 择 m， 我 们 定义 符号 申 为 a”"” (除非 对 手 选择 m <3， 我 们 可 以 用 a3' 代 赫 w)。w 
的 各 种 分 解 只 是 在 子 串 的 长 度 上 有 区 别 。 假 设 对 手 挑选 y， 满 足 
| 中 = 大 生产 
那么 我 们 就 考虑 长 度 为 ml! -大 的 xz。 只 有 存在 一 个 /， 满 足 
ml 一 大 = 站 
时 ， 这 个 符号 申 才 属于 L。 但 是 这 是 不 可 能 的 ， 因 为 对 于 m>>2 和 k< m 我 们 都 有 
一 大 > (1a 一 1)! 
因此 ， 这 种 语言 不 是 正则 的 。 口 
在 某 些 情况 下 ， 寺 亲 性 质 可 以 用 来 把 一 个 给 定 问题 和 我 们 已 经 分 过 类 的 革 个 问 题 联系 起 
来 ， 这样 做 ， 比 直接 应 用 泵 引 理 简单 得 多 。 
例 4.12 证 明 语 言 L = {a"b*c"** :n>0,k>0} 不 是 正则 的 。 
直接 应 用 泵 引 理 不 难 ， 但 是 使 用 同 态 下 的 封闭 性 会 更 容易 。 邻 
h(a) = a, h(b)=a,h(c)=c¢e 


则 有 
h(L)= {a"ttc"+t:n+k2>0} 
= {a'ci:i20} 
但 是 因为 我 们 知道 这 种 语言 不 是 正则 的 ， 所 以 ZL 也 不 可 能 是 正则 的 。 DOD 


例 4.13 证 明 语言 L = {a”b': nz 站} 不 是 正则 的 。 

这 里 我 们 需要 灵活 地 直接 应 用 泵 引 理 。 选 择 具有 n = ! + 1 或 = ! + 2 的 符号 串 都 不 行 ， 因 
为 我 们 的 对 手 总 会 找到 一 种 分 解 方式 使 我 们 无 法 抽出 不 属于 该 语言 的 符号 串 ( 即 : 抽出 的 符 
号 串 中 ，a 和 b 的 个 数 相 同 )。 我 们 必须 更 有 创造 力 才 行 。 我 们 令 n = m!，! = (m + 1)!。 如 果 对 
手 选 出 长 度 k<n 的 y (必须 是 只 包含 4)， 我 们 抽取 i 次 ， 得 到 具有 m! + (i 一 1 个 a 的 符号 串 。 如 
果 我 们 选择 的 i 满足 

m!l+(i— Dk= (m+1)! 
就 可 以 推出 和 泵 引 理 矛盾 的 结论 。 这 个 等 式 总 是 有 可 能 成 立 的 ， 因 为 
mm! 


fi = + 一 -一 
天 


并 且 k< m。 等 式 右 侧 是 整数 ， 因 此 我 们 成 功 地 推出 和 友 引 理 相 矛 盾 。 
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还 有 一 种 更 好 的 解决 方案 。 假 设 L 是 正则 的 ， 那 么 ， 根 据 定 理 4.1， 工 和 语言 
Li= LNL(a'b’) 

也 都 是 正则 的 。 但 是 ， 我 们 知道 Li = {a"b" : n>0} 不 是 正则 的 ， 所 以 L 不 是 正则 的 。 口 

下 面 儿 方面 的 原因 使 得 泵 引 理 的 应 用 并 不 简单 。 首 先 ， 泵 引 理 的 声明 复杂 ， 所 以 应 用 时 
容易 出 错 。 然 而 ， 即 使 我 们 掌握 了 这 种 技术 ， 仍 然 很 难 弄 清楚 具体 如 何 使 用 它 。 和 泵 引 理 就 像 
一 个 具有 复杂 规则 的 游戏 。 了 解 规则 是 必需 的 ， 但 是 ， 仅 仅 知 道 这 一 点 还 不 足以 玩 好 这 个 游 
戏 。 你 还 需要 有 一 个 好 的 策略 才能 够 赢得 游戏 。 如 果 你 可 以 正确 应 用 泵 引 理 来 解决 本 书 中 的 
一 些 难题 ， 那 么 就 要 祝 瞻 你 了 。 


习题 


-证 明 下 面 版 本 的 泵 引 理 。 如 果 是 正则 的 ， 那 么 存在 一 个 m， 满 足 每 个 长 度 大 于 m 的 wEL 都 
可 以 分 解 成 w = xyz， 其 中 


CN 


lyz| <m 
yl>1 


满足 对 于 所 有 的 i，xy'z 都 属于 L。 . 
下面 是 泵 引 理 的 一 般 化 推广 ， 定 理 4.8 和 习题 1 都 是 它 的 特例 。 证 明 这 个 普遍 适用 的 泵 引 理 。 
如 果 7 是 正则 的 ， 那 么 存在 产 满足 对 于 任意 足够 长 的 wEZ 及 它 的 任意 一 种 分 解 w = uivu,， 
其 中 心 , 2E2 ,中 > 严 ， 下 面 的 结论 都 成 立 。 中 间 的 符号 串 v 都 可 以 写成 v = xyz 的 形式 ， 其 中 
jxy| < m, |y| > 1， 广 足 对 于 所 有 的 = 0, 1, 2,…， 都 有 wxyizuyEL。 欧 
. 证 明 语 言 L = {w : ns(w) = m6(w)} 不 是 正则 的 。 芽 是 正则 的 吗 ? 
.证 明 下 列 语言 不 是 正则 的 : 
(a L= {arbiac: >7+ 有 各 
(b) L= {a'biat :大 关于 十 全 
(c) 工 = {a"bia* : n= [或 1 人 
(d) L= {a'b':n «<!} 
(e) LL= {w: nw) rn(w)} 区 
(f)L= {ww : wEt{a, b}} 
(g)L= {wwwwr : wE{a, by 
. 判断 下 面 定义 在 = {a} 上 的 语言 是 否 是 正则 的 : 
(a) 工 = {a :n>2,， nn 是 质数 } 藉 
(b) 上 = {a" : n 不 是 质数 } 
(Cc) 工 = {a" : 对 于 某 个 k>0, n= 尼 } 
(d) = {a" : 对 于 某 个 k>20，n = 2 分 
(e) = {a” : n 是 两 个 质数 的 乘积 } 
(f) 工 = {a" :; nn 要么 是 质数 ， 要么 是 两 个 或 更 多 质数 的 乘积 } 
. 直接 应 用 泵 引 理 来 证 明 例 4.12 中 的 结论 。 
.证 明 下 面 的 语言 不 是 正则 的 : 
L= {a'bt:n>k}Uf{ab: :nzk— 1} 


iD 


和 人 


un 


-OO 
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.证 明 下 面 的 命题 成 立 或 不 成 立 。 


如 果 L, 和 Ls 是 非 正则 语言 ， 那 么 LiUL 也 是 非 正则 的 。 浊 


. 考察 下 列 语言 。 对 于 每 一 个 ， 判 断 它 是 否 是 正则 的 ， 并 证 明 你 的 结论 。 


(dL=t{aba:nt+l1+k>5} 
(bD)L={abat:n>5,l>3,k<1}@ 
(c) 工 = {a"b!': n/! 是 整数 } 

(d) 工 = {a"b': n+! 是 质数 } 

(e)} L= {ab':n<l<2n} 

(f) L= {a'b': n> 100,1< 100} 

(g) L= {a'b': |n -1|=2} 


10. 下 面 的 语言 是 正则 的 吗 ? 


L= {wicwz : wi, waE{fa,pb Www)} 


11. 设 L 和 LL 是 正则 语言 。 语 言 L = {w : wEDi, wfEL,) 一 定 是 正则 的 吗 ? 物 
12. 直接 将 铝 集 原理 应 用 到 例 4.8 的 语言 
13. 下 面 的 语言 是 正则 的 吗 ? 


(a) 工 = {uwwry : u,v, wEfa, pb 类 
次 (b) 工 = {u :ou wEfa 5b}', |u|>|y|} 银 


14. 下 面 的 语言 是 正则 的 吗 ? 


L= {wwev :v, wEf{a, b}'} 


15. 设 P 是 一 个 无 穷 可 数 的 集合 ， 并 且 和 语言 [中 的 每 个 peEP 相 联系 。 包 含 所 有 L, 的 最 小 集合 


为 无 穷 集 P 上 的 并 ,表示 成 UpEpL。。 使 用 例子 证 明正 则 语言 族 在 无 穷 并 运算 下 不 封 
闭 。 允 


友 16. 考察 3.2 节 中 的 命题 一 -和 任何 通用 转移 图 相关 的 语言 都 是 正则 的 。 和 这 个 图 相关 的 语 


言 是 
L=[ jp) 
pEP 
其 中 ，P 是 图 中 所 有 的 通道 构成 的 集合 。r, 是 和 通道 p 相 关 的 表达 式 。 通 道 的 集合 一 般 是 


无 穷 的 ， 因 此 根据 习题 15， 不 会 立刻 有 Z 是 正则 的 结论 。 在 这 里 证 明 : 因为 P 的 特殊 本 
质 ， 无 穷 并 也 是 正则 的 。 | 


妈 17. 正则 语言 族 在 无 穷 交 运算 下 是 封闭 的 吗 ? 多 
18. 假设 我 们 已 知 5,UL 和 是 正则 的 。 是 否 可 以 因此 得 出 结论 是 正则 的 ? 
19. 在 3.1 节 习题 22 的 循环 码 语言 中 ， 设 L 是 由 所 有 描述 矩形 的 wE{u, ~, 1, d}* 构 成 的 集合 。 证 明 


[不 是 正则 语言 。 





第 5 章 上 下 文 无 关 语 言 


在 上 一 章 中 ， 我 们 发 现 不 是 所 有 的 语言 都 是 正则 的 。 因 为 正则 语言 可 以 有 效 地 描述 某 种 
简单 模式 ， 所 以 不 必 花 很 大 气力 去 找 那 些 非 正 则 语言 的 例子 。 如 果 我 们 重新 解释 这 些 例 子 ， 
程序 设计 语言 的 这 些 限 制 的 相关 性 就 会 变 得 明显 。 如 果 在 L = {a”b" : n>0} 中 ， 我 们 用 左 括号 
代替 a， 右 括号 代替 5， 那么 括号 串 (()) 和 ((())) 就 属于 ,但 是 (( ) 不 属于 L。 因 此 ， 这 
种 语言 描述 了 程序 设计 语言 中 一 种 简单 的 戏 套 结构 ， 这 就 意味 着 程序 设计 语言 的 某 些 属 性 需 
要 某 些 正则 语言 不 有 具有 的 性 质 。 为 了 满足 这 个 要 求 和 其 他 的 复杂 特点 ， 我 们 必须 扩大 语言 族 。 
这 就 导致 了 我 们 必须 考虑 上 下 文 无 关 (context-free) 语言 及 其 文法 。 

我 们 首先 在 这 章 的 开头 定义 了 上 下 文 无 关 文 法 和 语言 ， 并 用 几 个 简单 的 例子 解释 这 个 定 
义 。 接 下 来 我们 考虑 重要 的 成 员 关 系 问 题 ， 特 别 地 ， 我 们 探讨 如 何 判 断 一 个 给 定 的 符号 串 
是 否 可 以 由 某 个 文法 推出 。 大 多 数 人 在 学 习 自 然 语言 的 时 候 都 熟悉 一 种 方式 ， 就 是 通过 文法 “|125 
推导 解释 一 条 语句 ， 我 们 称 之 为 分 析 (parsing )。 分 析 是 描述 语句 结构 的 一 种 方式 。 每 当 我 们 
需要 理解 语义 的 时 候 ， 例 如 要 把 一 种 语言 翻译 成 另 一 种 语言 时 ， 分析 是 非常 重要 的 。 在 计算 
机 科学 领域 ， 分 析 和 解释 器 、 编 译 器 及 其 他 翻译 程序 都 是 相关 的 。 

上 下 文 无 关 语 言 恐 怕 是 形式 语言 理论 中 最 重要 的 一 个 方面 ， 因 为 它 可 以 应 用 到 程序 设计 
语言 中 。 实 际 程序 设计 语言 有 很 多 特点 可 以 通过 使 用 上 下 文 无 关 语 言 的 方法 来 描述 。 形 式 语 
言 理 论 告诉 我 们 ， 上 下 文 无 关 语 言 在 程序 设计 语言 的 设计 和 有 效 编译 器 的 构造 方面 都 有 重要 
的 应 用 。 我 们 在 5.3 节 将 简单 接触 这 方面 的 问题 。 


5.1 上 下 文 无 关 文法 


正则 文法 的 产生 式 有 两 方面 的 限制 : 左 部 必须 是 一 个 简单 变量 ， 并 且 右 侧 有 固定 的 形式 。 
为 了 创造 出 更 强大 的 文法 ， 我 们 必须 放宽 这 些 限制 。 保 留 左 部 的 限制 ， 但 是 允许 右 侧 可 以 是 
任何 形式 ， 这 样 我 们 就 获得 了 上 下 文 无 关 文法 。 

定义 5.1 文法 G = (V,T, $, P) 称 为 上 下 文 无 关 的 (context-free )， 如 果 P 中 的 产生 式 具 有 
形式 


A—x 


其 中 ，4EV，xE(VYU7T 

语言 L 是 上 下 文 无 关 的 ， 当 上 且 仅 当 存在 一 个 上 下 文 无 关 的 文法 G， 满 足 L = L(G)。 

每 个 正则 文法 都 是 上 下 文 无 关 的 ， 因 此 正则 语言 也 是 上 下 文 无 关 的 。 但 是 ， 我 们 从 简单 
例子 如 {a"b"}， 可 以 知道 存在 非 正 则 语言 。 我 们 在 例 1.11 中 指出 这 种 语言 可 以 由 一 种 上 下 文 无 
关 文 法 生成 。 因 此 ， 我 们 得 出 正则 语言 族 是 上 下 文 无 关 语言 族 的 真子 集 。 

上 下 文 无 关 文法 得 名 于 句 型 中 出 现 的 产生 式 的 左 部 变量 可 以 在 任何 时 候 被 替换 ， 这 种 蔡 
换 不 依赖 于 句 型 中 的 其 他 符号 (上 下 文 )。 这 个 特点 就 是 只 允许 产生 式 左 部 有 一 个 简单 变量 的 
理由 。 
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5.1.1 上 下 文 无 关 语 言 的 例子 
例 5.1 文法 G = ({5}, {a,5}, 5S,P)， 产生 式 


S—asSa 
S—bSb 
3 一 人 


这 个 文法 是 上 下 文 无 关 的 。 它 的 一 个 典型 推导 是 
S—aSa=>aaSaa=—aabSbaa=>aabbaa 
这 样 就 可 以 清楚 知道 
L(G) = {ww : wE{a, b}'} 


这 个 语言 是 上 下 文 无 关 的 ， 但 是 正如 例 4.8 所 示 ， 它 不 是 正则 的 。 口 
例 5.2 文法 G 具 有 产生 式 
S—>abB 
A—aaBb 
B—bbAa 
4 一 人 


这 个 文法 是 上 下 文 无 关 的 。 我 们 把 这 个 留 给 读者 去 完成 ， 看 看 它 生 成 的 语言 是 不 是 
L(G) = {ap(ppaa)"ppa(pa) : n> 0} 口 


上 面 两 个 有 关 文 法 的 例子 不 仅 是 上 下 文 无 关 的 ， 而 且 还 是 线性 的 。 正 则 和 线性 文法 明显 
都 是 上 下 文 无 关 的 ， 但 是 上 下 文 无 关 文 法 不 一 定 是 线性 的 。 

例 5.3 语言 L = {a"b”: nm} 是 上 下 文 无关 的 。 

为 了 证 明 这 一 点 ， 我 们 需要 一 个 产生 这 种 语言 的 上 下 文 无 关 文 法 。n = m 的 情况 在 例 1.11 中 
已 经 解决 ， 我 们 可 以 利用 它 来 构造 结果 。 令 n>m。 我 们 首先 生成 一 个 具有 相同 个 数 a 和 4b 的 符 
号 串 ， 然 后 在 左 部 加 入 额外 的 a。 这 样 的 得 到 产生 式 为 

S—AS, 
Si ->aSiB|4 
A—aAla 
对 于 n <m 的 情况 ， 我 们 使 用 类 似 的 推理 ， 得 到 结果 
S—ASI|SIB 
Si—aSib|A 
4 一 a4|a 
B—bBlb 


得 到 的 这 个 文法 是 上 下 文 无 关 的 ， 因 此 L 是 上 下 文 无 关 语 言 ， 但是， 文法 不 是 线性 的 。 

这 里 给 出 的 特殊 文法 形式 ， 是 为 了 方便 解释 。 还 有 很 多 与 之 等 价 的 上 下 文 无 关 文法 。 事 
实 上 ， 这 种 语言 还 存在 着 简单 的 线性 文法 。 在 本 节 后 面 的 习题 25 中 ， 我 们 会 要 求 你 构造 一 个 
线性 文法 。 口 
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例 5.4 考虑 具有 下 列 产生 式 的 文法 
S—aSb|SS|A 
这 也 是 个 上 下 文 无 关 文法 ， 但 不 是 线性 文法 。L(G) 中 有 串 abaabb，aababb 和 ababab。 不 难 狂 
测 和 证 明 
了 = {wEf{a, by :no(w) = m6(w) 且 no(Y)> ns(v)， 这 里 ，v 是 w 的 任意 前 级 } (5-1) 
如 果 我 们 分 别 用 左右 括号 代 赫 a 和 4b， 我 们 就 可 以 清晰 地 看 出 语言 L 与 程序 设计 语言 的 联系 。 语 | 
言 上 包括 符号 串 (0) 和 000。 事 实 上 ， 这 种 语言 就 是 通用 程序 设计 语言 所 有 正确 幅 套 的 括号 


Go 


结构 的 集合 。 
对 该 文法 也 存在 很 多 与 其 等 价 的 文法 。 但 是 ， 和 例 5.3 不 同 的 是 ， 很 难看 出 它 是 否 有 线性 
文法 。 我 们 将 在 第 8 章 回答 这 个 问题 。 口 


5.1.2 最 左 推导 和 最 右 推导 


在 非 线 性 的 上 下 文 无 关 文 法 中 ， 推 导 可 能 包括 由 多 个 变量 构成 的 句 型 。 这 种 情况 下 ， 为 
了 替换 变量 我 们 可 以 进行 选择 。 以 文法 G = ({4, 8, 5}, {4,5}, 5, 了) 为 例 ， 其 产生 式 为 
1.S—AB 
2. A—aaA 
3. 4 一 人 
4.B—Bb 
5.B—A 


很 容易 看 出 这 个 文法 产生 的 是 语言 L(G) = {a”b” :n>0,m>0}。 
考虑 下 面 这 两 种 推导 : 


SABSaaAB SaaB SaaBb Saab 


和 
SABSABb SaaABb Saahb Saab 


为 了 表示 使 用 的 是 哪个 产生 式 ， 我 们 将 产生 式 进 行 编 号 ， 并 在 符号 一 上 标 出 相应 的 编号 。 由 
此 我 们 可 以 看 到 ， 这 两 种 推导 不 仅 得 到 了 同一 个 句子 ， 而 且 使 用 了 相同 的 产生 式 。 它 们 不 同 
的 仅仅 是 产生 式 的 使 用 顺序 。 为 了 去 掉 这 些 不 相关 的 因素 ， 我 们 经 常 要 求 变量 要 按照 固定 的 
顺序 被 替换 。 
定义 5.2 ”如 果 每 次 都 替换 名 型 中 最 左 端 的 变量 ， 那 么 这 种 推导 称 为 最 左 的 【leftmost)。 
如 果 每 次 都 替换 最 右 端 的 变量 ， 那 么 就 称 这 种 推导 为 最 右 的 (rightmost )。 129 
例 5.5 考虑 具有 下 面 产生 式 的 文法 
S—aAhB 
A—bBb 
B—A|A 


S—aAB=>abBbB=—abAbB=>abbBbbB=>abbbbB=>abbbb 
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是 符号 串 abbbb 的 最 左 推 娃 。 这 个 符号 串 的 最 右 推导 为 
S=—aAB=—aA=>abBb=>abAb=—abbBbb=>abbbb 口 ] 


5.1.3 推导 树 


还 有 另 一 种 表示 推导 过 程 的 方式 ， 叫 做 推导 树 (derivation tree)， 这 种 方式 与 产生 式 的 使 
用 顺序 无 关 。 推 导 树 是 -- 个 有 序 树 ， 其 中 结 点 标记 的 产生 式 是 左 部 的 符号 ， 结 点 的 子 结 点 表 
示 的 是 该 产生 式 右 部 的 符号 。 例 如 ， 图 5$-1 表 示 下 面 产生 式 的 推导 树 的 那 部 分 。 
A—abABc 


在 推导 树 中 ， 标 记 有 产生 式 左 部 变量 的 结 点 是 根 结 点 ， 标 记 有 相应 产生 式 右 部 的 符号 的 结 点 
是 该 根 结 点 的 子 结 点 。 以 标 有 开始 符 的 根 结 点 开始 ， 到 标 有 终结 符 的 叶 结 点 结束 。 推 导 树 可 
以 表示 推导 过 程 中 每 个 变量 是 如 何 被 替换 的 。 下 面 的 定义 给 出 了 一 个 准确 的 表示 。 


) VY © YO OD 


图 5-1 


定义 5.3 G = (V, T, 83, 户 是 一 个 上 下 文 无 关 文 法 。 当 且 仅 当下 列 性 质 成 立时 ， 一 个 有 序 
树 才 能 称 为 是 G 的 推导 树 。 
1. 根 结 点 标记 为 S。 
2. 每 个 叶 结 点 有 一 个 属于 TU{X} 的 标记 。 
3. 每 个 中 间 结 点 (不 是 叶 结 点 的 结 点 ) 都 有 一 个 属于 8 的 标记 。 
4. 如 果 一 个 结 点 有 标记 4EV， 它 的 子 结 点 标记 (从 左 到 右 ) 为 qj, qs,…, a,， 那 么 ，P 中 一 
定 包含 下 面 形式 的 产生 式 


A—aiay…a, 


5. 标记 为 A 的 叶 结 点 没有 兄弟 ， 即 : 一 个 具有 标记 为 A 的 子 结 点 的 结 点 只 能 有 一 个 子 结 点 。 
如 果 一 棵 树 拥有 性 质 3、4 和 5， 但 是 1 不 一 定 成 立 ， 并 且 把 2 替换 成 : 
2a. 每 个 叶 结 点 都 有 属于 VUTU{A} 的 标记 。 
那么 这 棵 树 就 是 部 分 推导 树 (partial derivation tree )。 
通过 从 左 向 右 地 读 树 上 的 叶 结 点 获得 的 符号 事 ， 忽 略 遇 到 的 任何 1， 称 为 树 的 果 (yield ) 。 
从 左 到 右 ” 的 本 语 描述 可 以 给 出 一 个 准确 的 意义 。 果 是 终结 符 构 成 的 符号 串 ， 是 按照 深度 优 
先 遍历 树 时 遇 到 的 字母 顺序 构成 的 ， 深 度 优先 遍历 总 是 先 遍历 最 左 部 没有 被 遍历 过 的 分 支 。 
例 5.6 已 知 文法 G， 它 的 产生 式 为 
S—aAB 
A—bBb 
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B—A|X 
图 5-2 中 的 树 是 G 的 部 分 推导 树 ， 而 图 5-3 中 的 树 是 推导 树 。 符 号 串 abBpB 是 第 一 棵 树 的 果 ， 它 
是 G 的 句 型 。 第 二 棵 树 的 果 abbbb，、 是 L(G) 的 句子 。 口 


5.1.4 名 型 和 推导 树 之 间 的 关系 


推导 树 给 推导 过 程 提 供 了 一 个 请 楚 易 懂 的 描述 方式 。 与 有 穷 自动 机 的 转移 图 类 似 ， 这 种 
清楚 的 描述 对 于 证 明 有 很 大 帮助 。 尽 管 这 样 ， 我 们 必须 首先 建立 推导 和 推导 树 之 间 的 联系 。 

定理 5.1 设 G = (V,T, 5, P) 是 上 下 文 无 关 文 法 。 那 么 对 于 每 个 wEL(G)， G 中 总 存在 一 个 
推导 树 ， 它 的 果 是 w。 反 过 来 ， 任 何 推导 树 的 果 都 属于 语言 L(G)。 同 样 ， 如 果 to 是 G 的 任何 一 
个 部 分 推导 树 ， 且 根 结 点 标记 为 5， 那么 f6 的 果 就 是 G 的 一 个 向 型 。 
证 明 : 首先 我 们 证 明 对 于 L(G) 中 的 任何 一 个 句 型 ， 都 存在 一 个 相应 的 部 分 推导 树 。 我 们 对 推 
导 步 数 作 归 纳 。 作 为 归纳 基础 ， 我 们 注意 对 于 一 步 推导 产生 的 句 型 ， 上 述 结论 都 是 成 立 的 。 
因为 $=>u 意 味 着 存在 产生 式 S 一 x， 根 据 定义 5.3 可 以 立即 得 到 这 个 结论 。 

假设 对 于 所 有 经 过 n 步 推导 得 出 的 句 型 ， 都 存在 一 个 对 应 的 部 分 推导 树 。 现 在 我 们 考虑 任 
何 需要 n + 1 步 推导 才能 产生 的 w， 一 定 满足 132 

SxAy, x, yE(VUT)', AEV 


这 是 经 过 n 步 推导 得 到 的 。 而 且 
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XAy=—>xaiady adny = w, EVUT 


因为 根据 归纳 假设 ， 存 在 一 个 具有 果 xAy 的 部 分 推导 树 。 并 且 因 为 文法 一 定 有 产生 式 4 一 4a14,… 
am， 我 们 按照 这 个 文法 扩展 标 有 4 的 叶 结 点 ， 就 得 到 了 具有 果 xa1a,…awy = w 的 部 分 推导 树 。 
根据 归纳 ， 我 们 可 以 说 对 于 所 有 的 句 型 ， 这 个 结论 都 成 立 。 
类 似 地 ， 我 们 可 以 证 明 每 个 部 分 推导 树 都 表示 某 个 句 型 。 我 们 把 这 个 证 明 留 作 习 题 。 
因为 推导 树 也 是 部 分 推导 树 ， 只 不 过 它 的 叶子 都 是 终结 符 。 因 此 ，Z(G) 中 的 每 个 旬 子 都 
是 G 的 某 个 推导 树 的 果 ， 并 且 所 有 推导 树 的 果 都 属于 L(C)。 国 
推导 树 指 出 了 获取 句子 的 过 程 中 用 到 了 哪些 产生 式 ， 但 是 没有 给 出 这 些 产生 式 应 用 的 顺 
序 。 推 导 树 能 够 表示 任何 推导 ， 反 映 了 顺序 是 无 关 的 ， 这 就 拉 近 了 我 们 和 下 一 步 讨论 之 间 的 
距离 。 根 据 定义 ,任何 wEL(G) 都 有 一 个 推导 ， 但 是 我 们 不 能 说 它 也 一 定 有 最 左 推导 和 最 右 推 
导 。 然 而 ,一 旦 有 了 推导 树 ， 我 们 就 可 以 通过 把 树 看 成 是 由 这 种 方法 构造 的 ， 即 总 是 由 树 的 
最 左边 变量 开始 扩展 的 ， 来 得 到 最 左 推导 。 完 成 了 这 些 细节 ， 我 们 得 到 了 一 个 不 是 很 惊人 的 


结论 ， 任何 wEL(G)， 既 有 最 左 推导 ， 也 有 最 右 推导 (细节 详 看 本 节 末 的 习题 24)。 


习题 


oo 


完成 例 5.2 中 的 证 明 ， 证 明 给 出 的 语言 是 由 该 文法 产生 的 。 
画 出 例 5.1 中 推导 对 应 的 推导 树 。 


按照 练习 5.2 中 的 文法， 给 出 w = abbbaabbaba 的 推导 树 。 使 用 推导 树 找到 它 的 最 左 推导 。 


证 明 例 5.4 中 的 文法 确实 产生 了 式 (5-1) 中 描绘 的 语言 。 禹 
例 5.2 中 的 语言 是 正则 的 吗 ? 


通过 证 明 每 个 以 3 为 根 的 部 分 推导 树 的 果 都 是 G 中 的 名 型， 来 完成 定理 5.1 的 证 明 。 
:分 别 为 下 面 语言 构造 上 下 文 无 关 文 法 。( 其 中 n>0,m>0) 


(a)L=t{av":n<mt+3} 泌 

(b)L={ab”:nxm—1} 

(ce) L= {ab” :nt2m} 

(DL= {ob":2n<m<3n) 萎 

(e) L= {wE{a,b : nd(w) +n,(w)} 

(f) 工 = {wEf{a,b}》 :ns(v) 2 m(v)， 其 中 v 是 w 的 任意 前 级 } 
(g)L= {wE{a, by :nw) = 2n,(w) + 1} 


: 为 下 列 语言 构造 上 下 文 无 关 文 法 。( 其 中 n>0,m>0,k>0) 


(a) 艺 = {a’b”ct :n= m 或 m < 说 千 

(b) = {a'b"ct ;n= m 或 mz} 

(cL= {ab"c :k=n+m} 

(d) L= {ab"ct :n+ 2m=k} 

(e) L= {aboncex :大 = 人 一 加 午 

(HL= {wE{a, b,c} :nw) + nw) zn(w)} 
(2)L= {ab"ct, kn+m)} 

(h) L= {a’b'ct :kKk>3} 
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9. 为 head(D) 构造 上 下 文 无 关 文 法 ，L 是 上 面 习题 7(a) 中 的 语言 。head 的 定义 参见 4.1 节 习题 18。 
10. 为 定义 在 2 = {a,b} 上 的 语言 L = {anwwsb" : wEZ”, n> 1} 构 造 上 下 文 无 关 文 法 。 
妈 11. 给 定 L 的 上 下 文 无 关 文 靶 G。 给 出 如 何 根据 文法 G， 构 造 文法 全， 使 得 LCG) = head(D)。 
12. 设 L = {a"b” : n> 0}，, 
(a) 证 明 L 是 上 下 文 无 关 的 。 沁 
(b) 证 明 对 于 给 定 E> 1，L* 是 上 下 文 无 关 的 。 
(c) 证 明 Z 和 L'* 是 上 下 文 无 关 的 。 
13. 工 是 习题 8 (a) 中 的 语言 ， 乙 是 习题 8 (d) 中 的 语言 ， 证 明 LiULy 是 上 下 文 无 关 语 言 。 
14. 证 明 下 面 语言 是 上 下 文 无 关 的 
L= {uvwv® : u,v, wE{a, b}’, ul = |w| = 2} 


友 15. 证 明 例 5.1 中 的 语言 的 补 是 上 下 文 无 关 的 。 沪 
16. 证 明 习 题 8 (c) 中 的 语言 的 补 是 上 下 文 无 关 的 。 
17. 证 明 语 言 L = {wicw; : wi, w2E{a, bj wi 关 w3}， 它 的 字母 表 为 > = {a, b, c}， 是 上 下 文 无 
关 的 。 
18. 给 出 符号 串 aapbbb 的 推导 树 ， 已 知 文法 为 
S—ABIA 
A—aB 
B—5Sb 
口头 描述 这 个 文法 生成 的 语言 。 
19. 已 知 具有 下 面 产生 式 的 文法 
S—aaB 
A—bBblA 
B—Aa 


证 明 符 号 串 aabpabba 不 属于 这 个 文法 生成 的 语言 。 福 


20. 已 知 下 面 的 推导 树 


这 是 符号 串 aab 的 推导 树 ， 构 造 它 的 简单 文法 G。 然 后 再 给 出 两 个 L(G) 中 的 句子 。 
21. 定义 包括 两 种 括号 (和 站 的 正确 嵌 套 的 括号 结构 。 直 观 上 ，([])，([]])[0] 是 正确 的 修 套 结 
构 ， 而 (D)] 或 (0Q] 都 不 是 。 根 据 你 给 出 的 定义 ， 给 出 一 个 可 以 生成 所 有 正确 嵌 套 括号 结构 的 
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上 下 文 无 关 文 法 。 

22. 给 出 定义 在 字母 表 {a,b} 上 的 所 有 正则 表达 式 集合 的 上 下 文 无 关 文法 。 . 

23. 给 出 一 个 上 下 文 无 关 文 靶 ， 使 之 能 够 生成 7 = {a, b},V = {4, 8, C} 的 上 下 文 无 关 文 法 的 所 
有 产生 式 。 

24. 证明: 如 果 C 是 上 下 文 无 关 文 法 ， 那 么 任意 一 个 wEL(G) 存 在 最 左 推导 和 最 右 推导 。 给 出 一 
个 根据 推导 树 进行 推导 的 算法 。 

25. 为 例 5.3 中 的 语言 构造 线性 文法 。 

26. 设 G = (V,T, 5, P) 是 上 下 文 无 关 文法 ,满足 它 的 每 个 产生 式 都 具有 A 一 y 的 形式 ， 其 中 ，|v| = 
k> 1。 证 明 任 何 wEL(G) 的 推导 树 ， 有 高 度 为 x»， 满 足 


(wl-l) 
] hg -一 
ogx|w| 1 


5.2 分 析 和 二 义 性 


我 们 一 直 以 来 关注 的 是 文法 的 一 般 性 质 。 给 定 文法 G， 我 们 学 习 用 G 可 以 推导 出 的 符号 串 
的 集合 。 在 实际 应 用 中 ， 我 们 也 关注 文法 的 分 析 性 质 : 给 定 终结 符 构成 的 符号 串 w， 我 们 想 要 
知道 w 是 否 属于 L(G)。 如 果 属 于 ， 那 么 我 们 想 要 得 到 w 的 推导 过 程 。 成 员 资 格 判定 算法 可 以 告 
诉 我 们 w 是 否 属于 L(G)。 术 语 分 析 (parsing) 描述 的 是 寻找 wEL(G) 的 推导 过 程 中 使 用 的 一 系 
列 产 生 式 。 


5.2.1 分 析 和 成 员 资 格 判定 


给 定 L(G) 中 的 符号 串 w， 我 们 可 以 按照 下 面 这 种 清晰 的 方式 分 析 它 。 我 们 系统 地 构造 所 
有 可 能 的 (比如 : 最 左 ) 推导 ， 看 着 推导 出 的 结果 是 否 能 够 匹配 w。 特 别 地 ， 第 一 回合 ， 我 们 
首先 看 所 有 具有 下 面 形式 的 产生 式 


S—>X 


从 而 发 现 所 有 可 以 由 5 一 步 推 出 的 x-。 如 果 所 有 这 些 结果 都 不 能 匹配 w， 那 么 下 一 个 回合 我 们 就 
把 所 有 可 以 应 用 的 产生 式 都 用 在 每 个 x 的 最 左边 的 变量 上 。 这 样 我 们 就 获得 了 一 个 名 型 的 集合 ， 
或 许 其 中 有 的 句 型 就 能 推出 w。 在 每 个 后 续 的 回合 中 ， 我 们 考察 所 有 最 左边 的 变量 ， 应 用 所 有 
可 以 应 用 的 产生 式 。 如 果 句 型 不 能 推出 w，、 就 抛弃 它 。 但 是 ， 一 般 来 说 ， 我 们 每 回合 都 会 获得 
一 些 可 能 的 句 型 。 第 一 回合 后 ， 我 们 获得 了 使 用 一 个 简单 产生 式 而 生成 的 名 型 ; 第 二 回合 后 ， 
我 们 获得 了 两 步 推导 可 以 得 到 的 句 型 ……. 如 果 wEL(C)， 那 么 它 一 定 有 有 限 长 度 的 最 左 推导 。 
因此 ， 这 种 方法 最 后 会 给 出 w 的 最 左 推导 。 

以 后 再 提 到 这 个 分 析 方 法 ， 我 们 就 称 它 为 穷 举 搜索 分 析 (exhaustive search parsing ) 。 
它 是 自 顶 向 下 分 析 (top-down parsing ) 的 一 种 形式 ， 我 们 可 以 把 它 看 成 是 自 根部 向 下 构造 
推导 树 。 

例 5.7 已 知 文法 

S—SSlaSblbSalA 


和 符号 串 w = aabb。 第 一 回合 ， 我 们 得 到 
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1. $=>55 
2. S=—>aSb 
3. S=>bSa 
4. 5 一 人 


根据 结果 ， 显 然 要 去 掉 最 后 两 个 推导 。 第 二 回合 ， 产 生 如 下 名 型 
3 一 9 一 959 
4 一 一 09D9 
4 一 9 一 Da9 
一 94 一 人 


这 些 句 型 是 通过 把 句 型 1 中 最 左边 的 S 尽 可 能 地 替换 掉 而 得 到 的 。 类 似 地 ，、 根 据 句 型 2， 我 们 又 
得 到 几 个 名 型 

S=—aSb=—aSSb 

S=—aSb=>aaSbb 

S—aSb=>abSab 

S—aSb=>ab 


再 去 掉 几 个 名 型 。 下 一 个 回合 ， 我 们 从 推导 中 得 到 最 后 的 实际 目标 符号 串 
S—aSb=>aaSbb=—>aabb 


因此 ，aapb 属 于 该 文法 在 这 种 情况 下 生成 的 语言 。 口 

穷 举 搜索 分 析 存 在 严重 的 缺陷 。 最 明显 的 缺陷 是 过 程 元 长 ， 所 以 不 适用 于 需要 使 用 高 效 
率 分 析 的 地 方 。 但 是 即使 效率 不 是 首要 的 因素 ， 还 存在 其 他 的 原因 使 它 可 能 不 被 使 用 。 当 使 
用 这 种 方法 分 析 wEL(G) 时 ， 若 得 不 到 属于 L(G) 中 的 符号 串 可 能 就 永远 都 不 会 停止 。 这 点 对 
于 前 面 的 例子 是 显然 的 。 对 于 w = ab， 这 种 方法 会 不 断 地 产生 试验 性 的 名 型 ， 除 非 我 们 使 用 
某 种 方式 使 它 停 下 来 。 

如 果 我 们 限制 文法 的 形式 ， 那 么 穷 举 搜索 分 析 的 不 终止 性 问题 就 相对 容易 解决 。 如 果 考 
察 例 5.7， 我 们 就 可 以 看 出 产生 式 S 一 4 带 来 的 麻烦 。 使 用 这 个 产生 式 可 以 减少 推导 出 的 后 继 句 
型 的 长 度 ， 因 此 我 们 就 不 容易 判断 出 什么 时 候 停止 推导 。 如 果 没 有 这 样 的 产生 式 ， 那 么 我 们 
的 困难 就 少 些 。 事 实 上 ， 我 们 想 要 消除 两 种 形式 的 产生 式 : A 一 和 4 和 A->8。 在 下 章 中 我 们 将 看 
到 ， 这 个 限制 并 不 影响 最 终 的 文法 表达 能 力 。 

例 5.8 文法 

S—SSlaSblbSalablba 


满足 给 定 的 需求 。 它 能 够 生成 例 5.7 中 提 到 的 语言 ， 除 了 空 申 。 
已 知 任何 wE{a, b}*， 穷 举 搜索 分 析 方 法 总 会 在 不 超过 |w| 回 合 时 停止 。 这 很 明显 ， 因 为 每 回 
合 句 型 的 长 度 至 少 增长 1。|w| 回 合 后 ， 我 们 或 者 产生 一 个 分 析 ， 或 者 我 们 可 以 知道 wEL(G)。 口 
这 个 例子 的 想法 可 以 一 般 化 ， 从 而 生成 上 下 文 无 关 语 言 的 定理 。 
定理 5.2 假设 G = (V,T,S,P) 是 上 下 文 无 关 文法 ， 并 且 不 具备 下 面 形 式 的 产生 式 


4 一 人 
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或 
A—B 
其 中 ，4, BEVY。 那 么 由 穷 举 搜索 分 析 法 可 以 生成 一 个 算法 ， 它 能 完成 : 对 于 任何 wEZ ， 要 么 
生成 W 的 一 种 分 析 ， 要 么 告诉 我 们 不 可 能 存在 分 析 。 
证 明 : 对 于 每 个 名 型 ， 考 虑 它 的 长 度 和 终结 符 的 个 数 。 推 导 的 每 一 步 中 ， 上 述 两 个 因素 至 少 
有 一 个 会 增长 。 因 为 句 型 的 长 度 和 终结 符 的 个 数 都 不 能 超过 |w|， 所 以 推导 过 程 不 能 超过 2|w| 
个 回合 。 那 么 至 多 经 过 这 么 多 回合 后 ， 我 们 要 么 会 得 到 一 个 成 功 的 分 析 ， 要 么 会 知道 文法 不 
能 产生 w。 和 图 
穷 举 搜索 分 析 法 从 理论 上 保证 了 分 析 总 是 可 以 进行 的 。 但 是 它 的 实践 意义 是 有 限 的 ， 因 
为 通过 这 种 分 析 得 到 的 句 型 的 长 度 可 能 特别 大 。 不 同 的 情况 到 底 能 产生 多 少 名 型 ， 没 有 人 能 
给 出 准确 的 一 般 结果 ， 但 是 我 们 知道 它 的 严格 上 限 。 如 果 我 们 只 限制 为 最 左 推导 ， 那 么 ,第 
一 回合 后 ， 我 们 得 到 的 名 型 不 超过 | 局 个 ， 第 二 回合 后 ， 得 到 的 名 型 个 数 不 超过 个 | 书 …… 在 定 
理 5.2 的 证 明 中 ， 我 们 可 以 观察 到 分 析 包括 的 回合 数 不 可 能 超过 2|w|， 因 此 ， 获 得 的 句 型 数量 
不 超过 
M=|Pl+ |Ph + +|Ph™ (5-2) 


这 就 意味 着 穷 举 搜索 分 析 的 工作 量 是 符号 串 长 度 的 指数 数量 级 ， 使 得 这 个 方法 的 代价 太 大 。 
当然 ， 式 (5-2) 只 是 一 个 范围 ， 句 型 的 数量 通常 要 小 得 多 。 但 是 ， 实 际 的 观察 结果 表明 穷 举 
搜索 分 析 在 大 多 数 情况 下 效率 是 很 低 的 。 

上 下 文 无 关 文法 的 更 有 效 的 分 析 方 法 的 构造 是 一 件 复杂 的 事情 ， 它 属于 编译 器 这 门 课程 。 
我 们 在 这 里 就 不 深究 它 了 ， 除 非 对 某 些 孤 立 的 结论 。 . 

定理 5.3 ”每 个 上 下 文 无 关 文 法 都 存 在 一 个 算法 ， 它 对 于 任何 wEL(G)， 都 能 以 和 |wl? 成 正 
比 的 步 数 进 行 分 析 。 

有 几 种 方法 可 以 解决 这 个 问题 ， 但 是 它们 都 太 复杂 了 ， 以 至 于 不 先 证 明 某 些 额 外 的 结论 
我 们 就 无 法 描述 它们 。 在 6.3 节 中 ， 我 们 将 再 次 简要 地 谈 及 这 个 问题 。 有 关 这 个 问题 的 细节 参 
见 Harrison 1978、Hopcroft 和 Ullman 1979。 这 里 不 深究 它们 的 细节 的 原因 在 于 这 些 算法 也 并 
不 令 人 满意 。 工 作 量 与 符号 串 长 度 的 三 次 宕 成 比例 增加 的 方法 ， 虽 然 比 指数 的 方法 好 些 ， 但 
是 也 不 是 太 有 效 ， 以 此 为 基础 的 编译 器 即使 对 于 中 等 长 度 的 程序 也 要 花费 大 量 的 时 间 分 析 。 
我 们 想 要 的 是 和 符号 串 长 度 成 正比 的 时 间 复 杂 度 的 分 析 法 。 我 们 把 这 种 方法 称 为 线性 时 间 
(linear time ) 分 析 算 法 。 我 们 还 不 知道 时 间 复 杂 度 为 线性 时 间 的 上 下 文 无 关 文 法 的 一 般 分 析 
法 ， 但 是 在 一 些 有 限制 的 特殊 例子 中 可 以 找到 这 样 的 算法 。 

定义 5.4 上 下 文 无 关 文法 G = (V,T 了 , 5, P) 是 简单 文法 (simple grammar 或 s-grammar)， 如 
果 它 的 产生 式 形式 都 是 


A~>ax 
其 中 ，AEV，aET, xEV*， 并 且 ， 任 何 对 (A,a) 在 已 中 至 多 出 现 一 次 。 
例 5.9 文法 
S—aSlbss|c 


是 简单 文法 。 文 法 
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S—aSlbSSlasSlc 
不 是 简单 文法 ， 因 为 对 (5,a) 既 出 现在 Sa5 中 ， 又 出 现在 Sa55 中 。 加 | 
尽管 简单 文法 相当 严格 ,但 是 它们 是 有 意义 的 。 我 们 在 下 一 节 将 会 看 到 ， 一 般 程序 设计 
语言 的 许多 特点 都 可 以 使 用 简单 文法 来 描述 。 
如 果 G 是 简单 文法 ， 那 么 L(G) 中 的 任何 符号 串 w 都 可 以 在 与 jw| 成 正比 的 时 间 复 杂 度 范围 内 
分 析 完 。 为 了 乔 清楚 这 一 点 ， 考 虑 穷 举 搜索 法 和 符号 串 w = 4z…a。 因为 左 部 为 8 且 右 部 由 @w 
开头 的 产生 式 至 多 有 一 个 ， 推 导 过 程 首先 为 
S=—aiA1A,…A, 


然后 ， 替 换 变量 4,， 但 是 又 因为 至 多 只 有 一 个 选择 ， 我 们 就 得 到 
S SaiaB1B,…A,…A, 
由 此 ， 我 们 可 知道 每 步 都 产生 一 个 终结 符号 ， 于是， 整个 过 程 一 定 会 在 |w| 步 内 完成 。 


5.2.2 文法 和 语言 的 二 义 性 


根据 我 们 的 命题 ， 可 以 知道 任何 给 定 的 wEL(G)， 穷 举 搜 索 分 析 一 定 会 产生 一 棵 w 的 推导 
树 。 我 们 说 “一 棵 ”， 而 不 是 特 指 某 棵 的 原因 在 于 可 能 存在 大 量 不 同 的 推导 树 。 这 种 情况 称 为 
二 义 性 (ambiguity )。 

定义 5.5 ”如果 对 菜 个 wEL(G) 至 少 存 在 两 哥 不 同 的 推导 树 ， 那 么 上 下 文 无 关 文 法 G 称 作 是 
二 义 性 的 《ambiguous )。 也 就 是 说 ， 二 义 性 意味 着 存在 两 个 或 两 个 以 上 的 最 左 或 最 右 推导 。 

例 5.10 例 5.4 中 的 文法 ， 产 生 式 为 SaSblSSI%， 有 二 义 性 。 因 为 句子 aabb 有 两 棵 推导 树 ， 
如 图 5-4 所 示 。 口 


5-4 


二 义 性 是 诸多 自然 语言 的 共同 特色 ， 自 然 语言 容许 二 义 性 并 以 不 同 的 方法 加 以 解决 。 在 
程序 设计 语言 中 ， 每 条 语句 只 应 该 有 一 种 解释 ， 要 去 除 二 义 性 。 我 们 通常 通过 重 写 一 个 等 价 
的 、 无 二 义 性 的 文法 来 达到 这 个 目的 。 

例 5.11 已 知 文法 G=(V,7,E,P)， 其 中 





96 人 第 5 葬 


V= {E,T} 
T= {a,b,c,+,+*, (,)} 


产生 式 为 

E—I 

E>E+E 

E>E*x*E 

lI—alblc 
符号 串 (a + b)xc 和 a*xb + c 属 于 L(G)。 很 容易 看 出 这 个 文法 生成 了 C 语 言 和 类 Pascal 语 言 的 数 
学 表达 式 的 严格 集合 。 这 个 文法 是 有 二 义 性 的 。 例 如 ， 符 号 串 a + bxc 有 两 棵 推导 树 ， 如 图 5-5 
所 示 。 口 





a) b) 
图 5-5 a+bxc 的 两 个 推导 树 


解决 这 个 二 义 性 的 一 种 方法 是 ， 像 程序 设计 手册 一 样 ， 建 立 操作 符 * 和 十 之 间 的 优先 级 。 
因为 通常 * 比 十 优先 级 要 高 ， 因 此 我 们 认为 图 5-5a 是 正确 的 分 析 ， 这 就 意味 着 在 执行 加 法 前 ， 
先 要 验证 子 表 达 式 bxc。 然 而 ， 这 个 解 出 现在 文法 范围 之 外 。 最 好 重 写 这 个 文法 ， 使 得 只 存在 
142| 一 种 分 析 。 
例 5.12 重 写 例 5.11 中 的 文法 我们 引入 新 的 变量 ， 让 V 为 {E, 7T, F, 站， 并 且 将 产生 式 变 成 
E—T 
7 一 严 
天 一 了 
E>E+T 
T—T*F 
F—(E) 
Tl—>alblc 
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句子 a + br*c 的 推导 树 如 图 5-6 所 示 。 这 个 符号 串 不 存在 其 他 的 推导 树 。 于 是 文法 是 无 二 义 性 的 。 
它 和 习题 5.11 中 的 文法 等 价 。 证 明 这 些 命题 在 特殊 情况 下 成 立 是 不 难 的 。 但 是 ， 一 般 情况 下 ， 
一 个 给 定 的 上 下 文 无 关 文 法 是 否 是 二 义 性 的 ， 或 者 两 个 上 下 文 无 关 文法 是 否 等 价 ， 这 两 个 问 
题 都 非常 难 回答 。 事 实 上 ， 在 后 面 我 们 会 证 明 不 存在 通用 的 算法 来 解决 这 些 问 题 。 口 





图 5-6 


在 前 面 的 例子 中 ,文法 的 二 义 性 可 以 通过 找 一 个 等 价 的 无 二 义 性 的 文法 来 消除 。 但 是 某 
些 情况 下 无 法 这 样 做 ， 因 为 语言 本 身 具有 二 义 性 。 143 
定义 5.6 ”如果 上 下 文 无 关 语 言 L 存 在 一 个 无 二 义 性 文法 ， 那 么 L 就 是 无 二 义 性 的 。 如 果 每 
个 生成 的 文法 都 是 二 义 性 的 ， 那 么 这 个 语言 是 固有 二 义 性 的 (inherently ambiguous )。 
表示 一 个 具有 固有 二 义 性 的 语言 有 点 困难 。 我 们 能 做 的 仅仅 是 给 出 一 个 例子 说 明 ， 说 明 
它 是 固有 二 义 性 的 。 
例 5.13 语言 
L= {ab"c"}Uf{ab"™c”"} 
其 中 ，n 和 m 是 非 负 整 数 。 这 是 一 个 具有 固有 二 义 性 的 上 下 文 无 关 语 言 。 
容易 证 明 语 言 L 是 上 下 文 无 关 的 。 注 意 


L= LUL, 
其 中 , 工 蚌 由 
S -Sicl4 
A—aAb|A 
生成 的 。 而 是 通过 一 个 类 似 的 文法 给 出 的 ， 它 的 开始 符 为 $,， 产 生 式 为 
Sa—aslB 


B—>bBc|A 
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于 是 ，Z 可 以 由 这 两 个 文法 合并 生成 ， 需 要 一 个 附加 的 产生 式 
S$—5,|S, 


这 个 文法 是 二 义 性 的 ， 因 为 符号 串 a"2"c"* 有 两 棵 推导 树 ， 一 个 开始 时 使 用 $ 一 9;， 另 一 个 
开始 时 使 用 $=S:。 当 然 不 能 因此 就 说 ZL 是 固有 二 义 性 的 ， 因 为 可 能 存在 某 个 非 二 义 性 的 文法 
可 以 产生 它 。 但 是 在 某 方 面 ,，L! 和 L, 存 在 着 冲突 的 需求 ， 第 一 个 对 a 和 5 的 数目 加 限制 ， 而 第 
二 个 对 5 和 c 的 数目 加 限制 。 尝 试 儿 次 就 会 使 你 确信 ， 不 能 把 这 两 个 需求 合并 在 同一 个 规则 集 
合 里 ,唯一 地 满足 n = m。 但 是 这 个 命题 的 严格 证 明 是 很 需要 技巧 的 ， 一 种 证 明 方 法 参见 
Harrison 1978 。 图 


习题 


1. 为 L(aaa*b + b) 构造 简单 文法 。 
2. 为 L = {a"b" :n> 1} 构 造 简单 文法 。 寺 
3. 为 L = {a"b"+!1 :n>2} 构 造 简单 文法 。 
4. 证 明 每 个 简单 文法 都 是 无 二 义 性 的 。 
5. 已 知 G = (V,7,5,P) 是 简单 文法 。 使 用 |V| 和 |T|， 给 出 一 个 描述 |P| 的 最 大 值 的 表达 式 。 
6. 证 明 下 面 的 文法 是 有 二 义 性 的 
S—ABlaaB 
4 一 al4a 
DB- 千 


7. 构造 一 个 和 习题 6 等 价 的 无 二 义 性 的 文法 。 
8. 使 用 例 5.12，、 给 出 (((a + 5b)*c)) + a + b 的 推导 树 。 
9. 证 明正 则 语言 不 可 能 是 固有 二 义 性 的 。 响 
10. 给 出 一 个 生成 2 = {a,5} 上 的 所 有 正则 表达 式 集合 的 无 二 义 性 文法 。 
11. 正则 文法 可 能 是 二 义 性 的 吗 ? 
12. 证 明 语 言 L = {ww" : wE{a,b}'} 不 是 固有 二 义 性 的 。 
13. 证 明 下 面 文法 是 有 二 义 性 的 
S—aSbS|bSaS|A 


14. 证 明 例 5.4 中 的 文法 是 有 二 义 性 的 ， 但 是 它 表示 的 语言 是 无 二 义 性 的 。 秽 

15. 证 明 例 1.13 中 的 文法 是 有 二 义 性 的 。 

16. 证 明 例 5.5 中 的 文法 是 无 二 义 性 的 。 

17. 使 用 穷 举 搜索 分 析 法 ， 按 照例 5.5 中 的 文法 ,分析 符 号 串 abbbbbb。 一 般 地 ， 分 析 这 种 语言 
中 的 任何 符号 串 w 需 要 多 少 回合 ? 

18. 证 明 例 1.14 中 的 文法 是 无 二 义 性 的 。 

19. 证 明 下 面 结论 ， 上 下 文 无 关 文 法 G = (V, T, 8, P) 中 ， 每 个 4EV 最 多 在 一 个 产生 式 的 左 侧 出 
现 一 次 。 那 么 G 是 无 二 义 性 的 。 

20. 构造 一 个 和 例 5.5 中 的 文法 等 价 的 文法 ， 使 它 满足 定理 5.2 的 要 求 。 各 
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5.3 上下文 无 关 文 法 和 程序 设计 语言 


形式 语言 理论 的 一 个 最 重要 的 应 用 是 程序 设计 语言 的 定义 和 它们 的 解释 器 、 编 译 器 的 构 
造 。 这 里 的 基本 问题 是 准确 地 定义 程序 设计 语言 ， 并 使 用 这 个 定义 作为 书写 有 效 、 可 靠 的 翻 
译 程序 的 起 点 。 正 则 语言 和 上 下 文 无 关 语 言 都 是 能 够 达到 这 个 目的 重要 方法 。 正 如 我 们 将 看 
到 的 ， 识 别 程序 设计 语言 中 的 简单 模式 时 ， 我 们 可 以 使 用 正则 语言 ， 但 是 就 像 我 们 在 本 章 的 
介绍 中 提 到 的 ， 我 们 需要 上 上下文 无 关 语言 来 给 更 复杂 的 情况 建 模 。 

和 其 他 语言 一 样 ， 我 们 可 以 根据 文法 来 定义 程序 设计 语言 。 通 常 ， 我 们 习惯 使 用 一 种 特 
殊 的 文法 来 定义 语言 ， 这 种 文法 称 为 巴克 斯 ~ 诺尔 形式 (Backus-Naur form, BNF)， 这 种 形式 
在 本 质 上 和 我 们 使 用 过 的 表示 方式 相同 ， 但 是 表现 形式 不 同 。 在 BNF 中 ， 变 量 放 在 尖 括 号 中 
表示 ， 终 结 符 不 用 特殊 标记 。BNF 也 使 用 辅助 符号 ， 比 如 | 。 因 此 ， 例 5.12 中 的 文法 使 用 BNF 
表示 为 

<expression>::=<term>|<expression> + <term> 


<term>::=<factor>|<term>*<factor> 


等 等 。 符 号 十 和 * 是 终结 符 。 符 号 | 在 我 们 的 表示 中 用 来 表示 或 的 关系 ， 同 时 用 ::= 代 替 一 。 程 
序 设计 语言 的 BNF 描 述 倾向 于 使 用 更 多 的 含义 明确 的 变量 标识 符 ， 从 而 清楚 地 表示 产生 式 的 
含义 。 但 是 ， 另 一 方面 这 两 种 表示 方式 之 间 却 又 不 存在 重大 差异 。 

类 Pascal 程 序 设 计 语言 的 很 多 部 分 由 于 使 用 了 上 下 文 无 关 文 法 的 严格 方式 表示 ， 所 以 容易 
受 定义 的 影响 。 例 如 ，Pascal 语 言 中 的 if-then-else 语 句 可 以 定义 为 


<if_statement>::= if <expression><then_clause><else_clause> 


这 里 关键 词 if 是 终结 符 。 所 有 其 他 的 术语 都 是 变量 ， 必 须 定 义 这 些 变 量 。 如 果 我 们 根据 定义 
5.4 检 查 这 个 ， 我 们 可 以 看 出 它 看 起 来 就 像 个 简单 文法 的 产生 式 。 左 边 的 变量 <if_starement> 总 
是 和 右边 的 终结 符 if 相 关 。 由 于 这 个 原因 ， 这 样 的 语句 容易 有 效 地 分 析 。 这 里 我 们 就 知道 了 为 
什么 要 在 程序 设计 语言 中 使 用 关键 字 。 关 键 字 不 仅仅 为 程序 阅读 者 提供 可 视 化 的 结构 信息 ， 
而 且 使 得 构造 编译 器 的 工作 变 得 大 为 容易 。 

不 幸 的 是 ， 并 不 是 一 个 典型 程序 设计 语言 的 所 有 特性 都 可 以 被 简单 文法 表示 的 。 上 面 
<expression> 的 规则 就 不 是 这 个 类 型 的 ， 因 此 ， 分 析 变 得 不 太 明 显 。 于 是 就 出 现 了 一 个 间 题 : 
我 们 允许 什么 样 的 文法 规则 ， 什 么 样 的 文法 规则 可 以 有 效 地 分 析 。 在 编译 器 领域 中 ， 进 一 步 扩 
展 所 谓 的 LL 文 法 和 LR 文 法 ， 这 两 种 文法 可 以 表达 程序 设计 语言 的 某 些 不 明显 的 特性 。 但 是 它 
们 可 以 在 线性 时 间 内 完成 分 析 。 这 不 是 个 简单 的 事情 ， 这 个 问题 涉及 的 很 多 内 容 都 不 属于 我 们 
要 探讨 的 范围 。 我 们 将 在 第 6 章 简单 地 接触 这 方面 的 问题 ， 但 是 从 我 们 的 目的 出 发 已 足够 了 : 
认识 到 这 样 的 文法 存在 并 且 已 经 被 广泛 地 研究 。 

与 此 相 联 系 的 是 ， 二 义 性 问题 承担 了 另 一 个 重要 意义 。 程 序 设计 语言 的 规约 必须 是 无 二 
义 性 的 ， 否 则 ， 被 不 同 的 编译 器 编译 ， 或 运行 在 不 同系 统 上 的 同一 个 程序 ， 可 能 产生 非常 不 
同 的 结果 。 如 同 例 5.11 所 示 ， 一 个 天 真 的 方法 很 容易 把 二 义 性 引入 到 文法 中 。 为 了 避免 这 样 
的 错误 ， 我 们 必须 能 够 识别 和 消除 二 义 性 。 一 个 相关 的 问题 是 一 种 语言 是 否 是 固有 二 义 性 的 。 
为 了 实现 这 个 目的 ， 我 们 需要 的 是 能 够 在 上 下 文 无 关 文 法 中 识别 和 消除 二 义 性 ， 并 且 判 断 一 
个 上 下 文 无 关 文 法 是 否 是 固有 二 义 性 的 算法 。 不 幸 的 是 ， 这 都 是 十 分 困难 的 问题 ， 在 后 面 ， 
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大 家 会 看 到 对 于 通常 情况 下 的 这 种 问题 是 不 可 能 解决 的 。 
程序 设计 语言 可 以 通过 上 下 文 无 关 文 法 建 模 的 特点 通常 是 和 它 的 语法 (syntax) 相关 的 。 
无 论 如 何 ， 它 通常 是 这 样 的 情况 : 不 是 所 有 语法 正确 的 程序 都 可 以 被 接受 的 。 对 于 Pascal 而 言 ， 
通常 BNF 的 定义 允许 按照 下 面 这 样 的 构造 
var x,y : real 


xX,Z: integer 


var x : integer 
Xx:=3.2 


147| 这 两 种 构造 都 不 被 Pascal 编 译 器 接受 ， 因 为 它们 都 违反 了 其 他 的 限制 ， 比 如 “ 整 型 变量 不 能 被 
赋值 为 实数 ”"。 这 种 规则 是 程序 设计 语言 语义 的 一 部 分 ， 因 为 它 和 我 们 如 何 解释 一 个 具体 结构 
程序 设计 语言 的 语义 是 一 个 复杂 的 问题 。 程 序 设计 语言 语义 的 规约 不 像 上 下 文 无 关 文 法 
这 样 优雅 而 简洁 。 结 果 ， 一 些 语义 特性 的 定义 简单 、 或 有 二 义 性 。 无 论 从 程序 设计 语言 方面 ， 
还 是 从 形式 语言 理论 方面 而 言 ， 定 义 程序 设计 语言 语义 都 还 是 一 个 正在 研究 中 的 问题 。 虽 然 
已 经 提出 了 几 种 解决 方法 ， 但 是 它们 都 不 能 够 被 普遍 接受 ， 而 且 不 能 像 上 下 文 无 关 语言 中 的 

语法 一 样 成 功 地 给 出 语义 的 定义 。 


习题 


1. 给 出 Pascal 语 言 中 的 <expression> 完 整定 义 。 
2. 给 出 Pascal 语 言 中 while 语 句 的 BNF 定 义 。( 不 用 定义 通用 的 <statement> 概 念 ) 
3. 给 出 一 个 BNF 文 法 描述 Pascal 程 序 和 它 的 子 程序 之 间 的 关系 。 
4. 给 出 FORTRAN 语 言 中 do 语句 的 BNF 定 义 。 
5. 给 出 定义 C 语 言 中 的 if-else 语 句 的 正确 形式 。 
6. 给 出 不 能 够 用 上 下 文 无 关 文法 描述 的 C 语 言 的 特性 的 例子 。 
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在 深入 学 习 上 下 文 无 关 语言 之 前 ， 我 们 首先 需要 关注 一 些 技术 方面 的 事情 。 在 上 下 文 无 
关 文 法 的 定义 中 ， 它 没有 对 产生 式 右 部 做 任何 限制 ， 而 这 种 完全 自由 的 形式 并 不 总 是 必要 的 ， 
事实 上 ， 在 某 些 情况 下 ， 它 甚至 会 对 文法 产生 不 良 影响 。 从 定理 5.2 即 可 以 看 出 ， 文 法 的 某 些 
限制 形式 在 应 用 中 是 方便 的 ; 而 且 通 过 消除 诸如 A 一 和 A 和 A 一 8 这 样 的 产生 式 也 可 以 简化 文法 ， 
因而 ， 上 下 文 无 关 文 法 的 限制 形式 是 必要 的 。 因 此 ， 我 们 就 有 必要 关注 文法 的 转换 方法 ， 通 
过 它们 可 以 将 任意 的 上 下 文 无 关 文法 转换 成 某 种 等 价 的 受 限 形式 。 在 本 章 中 ， 我 们 将 学 习 几 
种 这 样 的 转换 方法 和 替换 规则 ， 在 以 后 的 讨论 中 将 会 用 到 它们 。 

针对 上 下 文 无 关 文 法 ， 我 们 也 将 学 习 一 些 相应 的 范式 (normal form)。 范 式 指 的 是 一 种 受 
限制 但 又 具备 足够 表达 能 力 的 文法 形式 ， 任 意 文 法 都 可 以 表示 成 相应 的 等 价 范 式 。 本 章 我 们 
将 介绍 两 种 有 用 的 范式 : 乔 姆 斯 基 范 式 (Chomsky normal form) 与 格 里 巴克 范式 (Greibach 
normal form )。 它 们 不 仅 在 理论 上 具有 重要 意义 ,同时 在 实际 中 也 被 广泛 应 用 。6.3 节 给 出 了 
乔 姆 斯 基 范 式 在 语法 分 析 中 的 直接 应 用 。 

由 于 本 章 大 多 数 证 明 过 程 可 操作 性 强 而 缺乏 直观 性 ， 因 此 ， 在 某 种 程度 上 ， 这 些 内 容 将 
会 显得 比较 枯燥 。 但 就 我 们 学 习 形 式 语言 的 目的 而 这， 技术 方面 的 东西 相对 来 说 是 不 重要 的 ， 
可 随意 阅读 。 但 最 终 得 到 的 各 种 结论 却 相 当 重 要 ， 在 我 们 以 后 的 学 习 中 ， 它 们 会 被 反复 用 到 。 


6.1 文法 变换 方法 


首先 ， 就 一 般 的 文法 与 语言 而 言 ， 它 们 都 会 存在 一 个 麻烦 的 问题 : 空 串 现象 。 而 且 在 很 
多 的 定理 及 其 证 明 中 ， 空 串 往往 表现 为 一 种 特殊 情况 ， 需 要 予以 特别 考虑 。 因 此 ， 为 了 化 简 ， 
我 们 可 以 选择 消除 空 串 ， 使 得 待考 察 的 语言 中 不 包含 MX。 从 下 面 的 讨论 中 就 可 以 看 出 ， 消 除 空 
串 不 会 使 文法 失去 一 般 性 。 设 L 是 某 一 上 下 文 无 关 语 言 ， 而 G = (V, 7, 5, P) 是 表示 L {4} 的 上 
下 文 无 关 文法 。 通 过 在 VY 中 增加 变量 %%， 并 使 它 作为 开始 变量 ， 同 时 在 P 中 增加 产生 式 
So 一 5 和 


这 样 得 到 的 新 文法 产生 的 语言 即 为 L。 因此， 我 们 可 以 得 到 一 个 重要 结论 : 工 - {四 总 是 可 以 转 
换 为 L。 同 样 ， 对 于 任意 的 上 下 文 无关 文 法 G， 存 在 一 种 方法 可 以 得 到 侣 并 使 得 L(G) = KG)- 
{4} ( 见 本 节 习 题 13)。 基 于 这 样 的 结论 ， 在 实际 应 用 中 ， 我 们 认为 包含 4 的 上 下 文 无 关 文 法 与 
不 包含 4 的 上 下 文 无 关 文法 是 没有 区 别 的 。 在 本 章 的 后 续 内 容 中 ， 除 非特 别 指出 ， 否 则 我 们 讨 
论 的 都 是 不 包含 4 的 上 下 文 无 关 语 言 。 


6.1.1 一 个 有 用 的 代入 规则 


通过 代入 方法 ， 很 多 规则 能 够 用 于 生成 等 价 文法 。 在 这 里 我 们 将 给 出 其 中 一 种 ， 它 可 以 
用 于 化 简 文 法 。 所 谓 化 兽 (simplification)， 我 们 虽然 无 法 给 出 它 的 准确 定义 ,但 仍 将 使 用 它 。 
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在 这 里 ， 我 们 认为 化 简 就 是 对 某 些 不 必要 产生 式 的 消除 ， 但 是 在 实际 的 化 简 过 程 中 ， 它 并 不 
必然 导致 产生 式 数 目的 减少 。 
定理 6.1 设 G =(V,7,5,P) 是 一 个 上 下 文 无 关 文 法 ，P 中 包含 一 个 形 如 


A—xiBx, 
的 产生 式 ， 其 中 A 与 B 是 不 同 的 变量 并 且 

Byilysl…ly, 
是 P 中 所 有 以 B 为 左 部 的 产生 式 集合 。 而 对 于 上 下 文 无 关 文 法 它 =(V,T,5,P)， 其 中 户 是 通过 删 
除 P 中 的 产生 式 


A—xBx, (6-1) 
并 增加 产生 式 
4 一 Xia|ziyaxza|…|ziyerz 
而 得 到 的 。 则 
L(G)= MO) 
证 明 : 假定 wEL(G)， 则 可 得 
Sw 
作为 推导 符号 = 下 标的 G 用 于 区 分 使 用 不 同文 法 进行 的 推导 。 如 果 访 推导 没有 使 用 式 (6-1)， 则 
Sw 


6 
显然 成 立 。 
否则 考虑 在 推导 中 第 一 次 使 用 式 (6-1) 的 情况 。 由 于 引入 的 变量 B 最 终 必须 被 替换 ， 因 此 ， 
如 果 我 们 假定 在 引入 8 之 后 就 立即 对 其 进行 替换 ( 见 本 节 习 题 17)， 而 这 么 做 并 没有 丢失 任何 
信息 。 因 此 可 得 | 
So uAus>o uxiBxads So UX YX2 U2 

而 在 文法 G 中 我 们 可 得 

二。 
这 样 通过 文法 G 与 6 可 以 得 到 相同 的 名 型 。 如 果 在 后 续 推导 中 重复 使 用 了 式 (6-1)， 则 可 以 采 
用 同样 的 证 明 方法 。 依 此 类 推 ， 对 使 用 该 产生 式 的 次 数 进 行 归纳 ， 可 以 得 到 


S$ 


uAu—> G LIXIYP2M2 


G w 
因此 ， 如 果 wEL(G)， 则 wEL( 6)。 
类 似 地 ， 可 以 证 明 如 果 wEL( 6)， 则 wEL(G)。 证 毕 。 力 ， 
定理 6.1 是 一 个 简单 而 又 直观 的 代入 规则 。 它 通过 将 所 有 产生 式 中 的 8 替换 成 8 一 步 推 导 可 
得 到 的 符号 串 ， 而 得 到 一 组 新 的 产生 式 作为 文法 的 组 成 部 分 ， 而 原 产 生 式 4->xBm 可 以 从 中 删 
除 。 该 结论 的 一 个 必要 条 件 是 4 与 B 是 不 同 的 变量 ， 对 A = 8 的 情况 ， 在 本 节 习 题 22 与 习题 23 中 
将 部 分 地 进行 阐述 。 
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例 6.1 考虑 文法 G = ({4,B}, {a,b,c},4,P)， 其 中 P 包 含 产 生 式 
A—alaaAlabBc 
B—abbAlb 


通过 对 变量 8 运用 本 节 的 代入 规则 ， 我 们 将 得 到 文法 6， 它 的 产生 式 如 下 
A—>alaaAlababbAclabbc 
B_>abbAlb 


根据 定理 可 知 ， 文 法 6G 与 G 是 等 价 的 。 对 于 串 aaabbc， 它 在 G 中 存在 推导 


A—aaA=—aaabBc=>aaabbc 


而 在 C 中 的 推导 为 


4 一 aa4 一 aaappc 


我 们 注意 到 ， 在 这 种 情况 下 ， 变 量 B 和 与 之 相关 的 产生 式 仍 在 文法 中 ， 虽 然 它们 在 任何 推 
导 中 都 不 再 起 作用 。 在 后 面 的 讨论 中 我 们 将 会 看 到 这 种 产生 式 是 怎样 从 文法 中 删除 的 。 口 


6.1.2 删除 无 用 产生 式 


我 们 总 是 希望 将 在 任何 推导 中 不 起 作用 的 产生 式 从 文法 中 删除 。 例 如 在 某 个 文法 中， 它 
的 产生 式 集 合 如 下 : 
S—aSb|AlA 
A—aA 


可 以 看 出 ， 产 生 式 $ 一 4 是 无 用 的 ， 因 为 不 能 从 4 推导 出 一 个 终结 符 串 。 虽 然 4 可 以 出 现在 从 8 
推导 出 的 某 个 串 中 ， 但 是 它 最 终 无 法 生成 一 个 句子 。 删 除 这 种 形式 的 产生 式 ， 对 语言 没有 任 
何 影响 ， 并 且 从 定义 上 来 看 ， 这 也 是 对 文法 的 化 简 。 
定义 6.1 设 G = (V,T, 8, P) 是 一 个 上 下 文 无 关 文 法 ， 如 果 变 量 AEV 是 有 用 的 (useful)， 
则 当 且 仅 当 至 少 存 在 一 个 wEL(G) 使 得 
SxAy Sw (6-2) 


其 中 x，y 铬 于 (VUT)*。 总 而 言 之 ， 某 个 变量 是 有 用 的 当 且 仅 当 它 至 少 在 一 个 向 子 的 推导 
中 出 现 ， 而 对 于 不 出 现在 任何 向 子 推导 中 的 变量 ， 我 们 称 之 为 无 用 的 〈useless )。 如 果 某 个 产 
生 式 包含 无 用 变量 ， 则 该 产生 式 是 无 用 的 。 

例 6.2 ”一 个 变量 无 用 的 可 能 原因 是 无 法 从 其 得 到 一 个 终结 符 串 ， 上 面 讨论 的 就 是 这 种 情 
况 。 而 通过 下 面 的 文法 ， 我 们 将 看 到 一 个 变量 是 无 用 的 另外 一 个 可 能 原因 。 在 该 文法 中 ， 开 
始 符 为 S， 它 的 产生 式 如 下 

S—A 
A—>aA|A 
B—>bA 


其 中 变量 8 是 无 用 的 ， 因 而 产生 式 8 一 b4 也 是 无 用 的 。 虽 然 能 够 从 B 推 导 得 到 一 个 终结 符 
串 ， 但 是 我 们 无 法 得 到 $ 兰 xBy。 口 





104 . 傈 6 葬 


上 述 例子 说 明了 一 个 变量 无 用 的 两 个 原因 : 或 者 无 法 从 开始 符 达 到 它 ， 或 者 无 法 从 其 推 
导出 一 个 终结 符 串 。 去 除 无 用 变量 与 产生 式 的 过 程 就 是 在 认识 到 这 样 两 种 情况 的 基础 上 进行 
的 。 在 给 出 一 般 情形 以 及 相应 的 定理 之 前 ， 我 们 将 给 出 另外 一 个 例子 。 
例 6.3 ”消除 文法 G = (Y, T, 5, P) 中 的 无 用 符号 与 产生 式 ， 其 中 Y = {5, 4, B, C}, T= {a， 
b}， 产 生 式 P 如 下 : 
S—aslAIC 
Aa 
B—aa 
153 C—aCb 


首先 我 们 将 标识 出 可 以 得 到 终结 符 串 的 变量 集合 。 由 于 A 一 a 且 B 一 aa， 因 此 4，B 属 于 该 
集合 。 同 理由 于 3 一 4 一 a， 因 此 $ 也 属于 该 集合 。 但 对 于 C， 由 于 无 法 得 到 这 样 的 一 个 结论 ， 
因而 它 是 无 用 的 。 通 过 删除 C 以 及 与 其 相关 的 产生 式 ， 可 以 得 到 文法 G,， 其 中 变量 W = {5, 4， 
8}， 终 结 符 集 7 = {a}， 产 生 式 集合 为 

S—aS|A 
A—a 
Baa 

接 下 来 ， 我 们 将 消除 无 法 从 开始 变量 达到 的 变量 。 针 对 这 种 情况 ， 我 们 可 以 通过 给 出 变 
量 依赖 图 (dependency graph) 来 完成 。 依 赖 图 作为 对 复杂 关系 的 一 种 可 视 化 表示 而 被 广泛 应 
用 。 对 于 上 下 文 无 关 文 法 的 依赖 图 ， 其 中 的 顶点 表示 变量 ,而 从 顶点 C 到 DD 之 间 存 在 边 当 且 仅 
当 存 在 如 下 形式 的 产生 式 

C—xDy 


图 6-1 所 示 为 V 的 依赖 图 。 如 果 一 个 变量 是 有 用 的 ， 仅 当 在 依赖 图 中 存在 一 条 路 径 ， 它 从 
以 3 为 标记 的 顶点 出 发 能 够 到 达 以 该 变量 标记 的 顶点 。 在 我 们 的 例子 中 ， 从 图 6-1 可 以 看 出 5 是 
无 用 的 。 通 过 删除 它 以 及 受到 其 影响 的 产生 式 与 终结 符 ， 我 们 将 得 到 最 终 文革 G = (V, 个,$, 户 )， 
其 中 乡 = 人, 入 ， 人 = {qa} ， 产 生 式 户 如 下 


S 一 a8|4 
4 一 0 
图 6-1 
根据 上 述 的 形式 化 过 程 可 以 得 到 一 个 一 般 性 的 构造 方法 以 及 相应 的 定理 。 口 


定理 6.2 设 G = (V, 7,5, P) 是 一 个 上 下 文 无 关 文 法 ， 则 存在 一 个 与 之 等 价 的 文法 己 =( 六 , 疗 
5,) ， 它 不 包含 任何 的 无 用 符号 或 产生 式 。 
证 明 : 文法 G 能 够 通过 一 个 算法 根据 G 生 成 ， 该 算法 包含 两 个 部 分 。 在 第 一 部 分 中 ， 将 构造 一 
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个 中 间 形 式 的 文法 G, = (Vi, 7, 5, P1)， 使 得 对 于 Vi 中 的 每 一 个 变量 4， 都 能 够 找到 如 下 形式 的 
推导 
A SwET 


第 一 部 分 的 算法 步 又 如 下 : 
1. 置 Vi 为 空 
2. 重复 下 面 的 步 旦 直到 再 也 没有 变量 能 够 加 到 岂 中 为 止 。 
对 于 任 一 AEV， 如 果 P 中 存在 形 如 
A 一 x1x.…x,， 其 中 所 有 x 都 在 ViUT 中 


的 产生 式 ， 则 将 4 加 入 到 VY 中。 

3. 对 于 P 中 的 每 -个 产生 式 ， 如 果 它 的 符号 都 在 (ViUT) 中 ， 则 将 其 加 入 到 Pi 中 。 

显然 ， 这 一 过 程 总 会 终止 。 同 样 可 以 看 出 ， 如 果 AEV,， 则 4 革 wET" 将 是 G1 中 的 一 个 可 能 
的 推导 。 则 剩 下 的 问题 就 是 是 否 对 存在 诸如 A 洁 w = ab… 推 导出 的 每 一 个 4， 在 本 过 程 结束 之 
前 都 将 被 加 入 到 Vi 中 。 为 了 说 明 这 一 问题 ， 可 以 考 虚 相应 的 4 以 及 与 该 推导 相关 的 部 分 推导 树 
(如 图 6-2)。 在 k 层 上 ， 只 有 终结 符 ， 因 此 k 一 1 层 的 每 一 个 变量 4, 都 将 通过 算法 的 第 2 步 在 第 一 
轮 中 被 加 入 到 V,，k 一 2 层 的 每 个 变量 将 通过 算法 的 第 2 步 在 第 二 轮 中 被 加 入 V1， 而 k -3 层 的 所 
有 变量 都 将 通过 第 2 步 的 第 三 轮 被 加 入 ， 依 此 类 推 。 只 要 在 树 中 还 有 变量 没有 加 入 被 到 Vi 中 ， 
该 算法 就 不 会 终止 。 因此， 所 有 这 种 形式 的 4 最 终 都 会 被 加 入 到 Vi 中 。 





图 6-2 


在 构造 方法 的 第 二 部 分 中 ， 我 们 将 从 G 生 成 结果 文法 G。 基 于 G; 的 变量 依赖 图 ， 可 以 得 [153] 
到 所 有 不 能 从 $ 到 达 的 变量 。 通 过 删除 这 些 变量 以 及 与 其 相关 的 产生 式 ， 同 时 也 删除 不 出 现在 
有 用 产生 式 中 的 终结 符 。 这 样 得 到 的 结果 就 是 文法 G=(V,T,s, 户 )。 
根据 构造 过 程 ， 可 以 看 出 6 中 将 不 包含 任何 的 无 用 符号 与 产生 式 。 针 对 任意 wEL(G)， 我 
们 有 推导 
SxAy Sw 


由 于 6 的 构造 过 程 保 留 了 A 以 及 所 有 相关 的 产生 式 ， 因 而 我 们 有 充分 的 条 件 进行 如 下 推导 


SxAyS ow 
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同时 ， 由 于 文法 6 是 通过 删除 G 中 的 产生 式 而 生成 的 ， 所 以 疡 CEP 。 因 而 L(G)C LG) 成 
立 。 综 合 上 述 结论 ， 可 以 得 到 ，G 与 6 是 等 价 的 。 国 


6.1.3 消除 4 产生 式 


在 上 下 文 无 关 文 法 中 ， 如 果 某 个 产生 式 的 右 部 是 空 叫 ， 则 该 产生 式 有 时 是 不 必要 的 。 
定义 6.2 上 下 文 无 关 文 法 中 任意 形 如 
4 一 人 
的 产生 式 称 为 和 产生 式 《(A-production)。 任 何 存在 推导 
4 之 人 (6-3) 
的 变量 A 称 为 可 空 的 (nullable ) 。 
一 个 文法 生成 的 语言 可 以 不 包含 A4， 但 它 仍 可 能 存在 4 产生 式 与 可 空 变量 。 在 这 种 情况 下 ， 
4 产生 式 是 可 以 消除 的 。 
例 6.4 考虑 文法 
S—aSib 
Si—aSiblA 
该 文法 生成 的 语言 {a"b” : n> 1} 不 包含 iA。 因而 ， 通 过 增加 一 些 新 的 产生 式 ， 这 些 产 生 式 是 用 和 
替换 出 现在 产生 式 右 部 的 9 得 到 的 ， 同 时 4 产生 式 9, 一 4 也 就 可 以 从 文法 中 消除 了 。 这 样 将 得 到 
新 文法 
S—aSiblab 
Si>aSiblab 
显而易见 ， 上 述 新 文法 与 原始 文法 生成 的 语言 相同 。 
在 更 一 般 的 情况 下 ， 和 产生 式 可 以 由 一 个 类 似 上 述 过 程 但 更 复杂 一 点 的 方法 消除 。 口 
定理 6.3 设 G 是 任意 的 上 下 文 无 关 文 法 且 4 不 在 L(G) 中 ， 则 存在 一 个 等 价 的 不 包含 4 产 生 
式 的 文法 G。 
证 明 : 首先 我 们 通过 如 下 步 又 找到 所 有 G 的 可 空 变量 的 集合 内 
1. 对 于 所 有 形 如 4 一 4 的 产生 式 ， 将 4 加 入 Vv 中 。 
2. 重复 下 述 步骤 直到 再 也 没有 新 的 变量 可 以 加 入 到 内 中 。 对 于 所 有 形 如 
B—AA,…A, 
的 产生 式 ， 如 果 A,, 4A,, …, 4, 都 属于 V、， 则 将 8 加 入 Vy 中 。 
一 旦 找到 集合 V,， 就 可 以 构造 产生 式 记 了 。 我 们 考察 P 中 所 有 形 如 


A—>xix2 Xn, m2>1 


的 产生 式 ， 其 中 XEVUT。 对 于 P 中 每 一 个 上 述 形式 的 产生 式 ， 我 们 将 该 产生 式 以 及 使 用 4 替换 
其 可 空 变量 所 有 可 能 组 合 而 得 到 的 产生 式 加 入 多。 例如 ， 如 果 x 和 是 可 空 的 ， 则 在 户 存在 一 
个 使 用 4 替换 x 的 产生 式 ， 一 个 使 用 4 替换 x 的 产生 式 ， 以 及 一 个 和 x 都 被 4 替换 的 产生 式 。 存 
在 一 种 特殊 情况 ， 如 果 所 有 的 x 都 是 可 空 的 ， 则 产生 式 4 一 4 将 不 被 加 入 中 。 
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对 6 与 G 等 价 性 的 证 明 是 简单 的 ， 我 们 将 它 留 给 读者 来 完成 。 国 
例 6.5 针对 文法 
S—ABaC 
4 一 BC 
-2 
C—>DIA 
D—d 
构造 一 个 等 价 的 上 下 文 无 关 文法 ， 使 得 它 不 包含 4 产生 式 。 
根据 定理 6.3 中 构造 方法 的 第 1 步 ， 我 们 可 以 得 到 可 空 变量 4, B, C。 然 后 通过 应 用 构造 方法 
的 第 2 步 可 以 得 到 
S—ABaCl|BaC|AaClABalaC|AalBala 
A—B|CIBC 


6.1.4 消除 单位 产生 式 


从 定理 6.2 可 以 看 出 ， 如 果 某 个 产生 式 的 两 边 都 是 单个 变量 的 话 ， 则 这 个 变量 有 时 是 不 必 
要 的 。 
定义 6.3 上 下 文 无 关 文法 中 形 如 
A—B 


的 产生 式 ， 其 中 4, BEV， 我 们 称 为 单位 产生 式 。 

为 了 消除 单位 产生 式 ， 我 们 运用 定理 6.1 中 讨论 的 代入 规则 。 根 据 下 面 定理 中 的 构造 方法 
可 以 看 出 ， 只 要 在 过 程 中 细心 ， 这 一 点 是 完全 可 以 做 到 。 

定理 6.4 设 G =(V,T,S,P) 是 一 个 任意 的 上 下 文 无 关 文 法 上 且 不 包含 1 产生 式 ， 则 存在 一 个 
上 下 文 无 关 文 法 局 =(V,T,5,P)， 它 与 G 等 价 且 不 存在 单位 产生 式 。 
证 明 : 显而易见 ， 任 意 形 如 4 一 4 的 单位 产生 式 都 可 以 直接 从 文法 中 消除 ， 不 会 影响 文法 产生 
的 语言 。 因 此 我 们 只 需要 考虑 形 如 4A->B 的 产生 式 ， 其 中 4 与 3 是 不 同 的 变量 。 告 一 看 ， 通 过 令 
Xi 三 二 A， 可 以 直接 运用 定理 6.1， 将 


A—B 
替换 成 
4 一 yz|… 
但 实际 上 这 并 不 总 是 可 行 的 ; 因为 在 存在 形 如 
A—B 


B-—>A 
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产生 式 的 特殊 情况 中 ， 单 位 产生 式 将 无 法 消除 。 为 了 解决 这 一 问题 ， 我 们 首先 针对 每 一 个 4， 
找到 所 有 的 变量 8B， 它 能 使 得 
AS>B (6-4) 
这 一 工作 我 们 可 以 通过 变量 依赖 图 来 完成 ， 如 果 文 法 中 存在 单位 产生 式 C->D， 则 在 依赖 图 中 
存在 边 〈C, D) ; 而 如 果 依 赖 图 中 4 与 B 之 间 存 在 一 条 通道 ， 则 式 (6-4) 成 立 。 新 文法 G 通 过 
如 下 方式 生成 ， 它 首先 将 所 有 的 非 单位 产生 式 P 加 入 ， 然 后 针对 所 有 满足 式 (6-4) 的 4 与 8， 
在 已 中 加 入 产生 式 
yy …| 
其 中 8 一 yilys…y, 是 户 中 所 有 B 为 左 部 的 产生 式 集合 。 注 意 到 由 于 B 一 yi|y,|…|y, 属 于 户 ， 所 以 任 
意 一 个 y 都 不 会 是 单个 变量 ， 因 此 在 最 后 这 一 步 中 不 会 生成 单位 产生 式 。 
为 了 说 明 结 果 文 法 与 原始 文法 是 等 价 的 ， 可 以 采用 与 定理 6.1 同 样 的 证 明 过程 。 国 
例 6.6 消除 文法 
S—AalB 
B—Albb 
A—albc|B 
中 的 所 有 单位 产生 式 。 
图 6-3 给 出 了 针对 单位 产生 式 的 依赖 图 ; 从 该 图 我 们 可 以 得 到 8 兰 4，8 兰 B， 有 从 4 以 及 4 二 有 
因此 通过 在 新 文法 中 加 入 原文 法 的 非 单 位 产生 式 
S—Aa 
4 一 dlpc 
B—>bb 
以 及 替换 单位 产生 式 而 得 到 的 新 产生 式 
S—>albc|bb 
A—bb 
B—>albc 
这 样 我 们 就 可 以 得 到 等 价 的 新 文法 
S—albclbblAa 
A—albblbc 
Balbblbc 


注意 单位 产生 式 的 消除 同时 导致 了 B 以 及 与 之 相关 的 产生 式 成 为 无 用 的 。 口 
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通过 将 所 有 的 前 述 结论 综合 起 来 ， 我 们 将 看 到 ， 对 于 上 下 文 无 关 语 言 的 文法 可 以 消除 其 
中 的 无 用 产生 式 、 和 产生 式 以 及 单位 产生 式 。 

定理 6.5 。 设 L 是 不 包含 A 的 上 下 文 无 美语 言 。 则 存在 一 个 产生 上 L 的 上 下 文 无 关 文 法 ， 该 文 
法 不 多 无 用 产生 式 、 人 产生 式 或 单位 产生 式 。 
证 明 : 定理 6.2、 定 理 6.3 以 及 定理 6.4 中 的 方法 分 别 销 除了 这 些 形式 的 产生 式 。 这 里 唯一 需要 
考虑 的 问题 是 ， 消 除 某 一 种 形式 的 产生 式 可 能 会 引入 其 他 形式 的 产生 式 ; 比如 ， 消 除 4 产 生 式 
可 能 会 引入 单位 产生 式 。 同 时 ， 定 理 6.4 中 要 求 文法 中 不 存在 4 产生 式 。 但 是 注意 到 消除 单位 
产生 式 不 会 引入 4 产生 式 ( 见 本 节 习 题 15) 以 及 消除 无 用 产生 式 不 会 引入 4 产生 式 或 单位 产生 
式 〈 见 本 节 习 题 16)。 因 此 我 们 可 以 通过 如 下 步骤 来 消除 所 有 这 些 不 合 要 求 的 产生 式 : 


1. 消除 和 产生 式 。 
2. 消除 单位 产生 式 。 
3. 消除 无 用 产生 式 。 
通过 上 述 步 又 得 到 的 结果 ， 消 除了 所 有 这 些 形式 的 产生 式 ， 定 理 得 证 。 国 
习题 
1. 通过 说 明 从 
3 全 5 w 
可 以 得 到 
SSow 


来 完成 定理 6.1 的 证 明 。 
. 在 例 6.1 中 ， 分 别 使 用 原始 文法 与 修改 文法 给 出 符号 串 abpabpac 的 一 个 推导 。 
.证 明文 法 


LO 


S—abABlba 
A—aaa 
B—>aAlbb 
与 文法 
S—abAaAlabAbblba 
A—aaa 
是 等 价 的 。 敬 


ES 


.在 定理 6.1 中 ， 为 什么 需要 假定 变量 A 与 B 是 不 同 的 ? 

. 消除 如 下 文法 的 所 有 无 用 产生 式 ， 并 给 出 由 该 文法 产生 的 语言 。 
S—as|4B 
A—bA 
B—AA 


un 


bo 


. 消除 如 下 文法 
S—alaA|BIC 
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A—aB|A 
B—Aa 
C—cCD 
D—>ddd 


的 无 用 产生 式 。 
7. 消除 如 下 文法 
S—AaBlaaB 
4 一 人 
B—>bbAlA 


的 所 有 4 产生 式 。 
8. 消除 如 下 文法 中 的 所 有 4 产生 式 、 单 位 产生 式 以 及 无 用 产生 式 。 并 给 出 由 该 文法 生成 的 语 
言 。 效 
S—>aAlaBB 
A~>aaAlA 
B—>bBlbbC 
C—B 


9. 消除 习题 7 中 文法 的 所 有 单位 产生 式 。 
10. 完成 定理 6.3 的 证 明 。 
11. 完成 定理 6.4 的 证 明 。 
12. 使 用 定理 6.3 中 的 构造 方法 消除 例 5.4 中 文法 的 4 产生 式 ， 并 给 出 由 该 文法 生成 的 语言 。 
13. 假定 G 是 一 个 上 下 文 无 关 文 法 且 AEL(G), 证 明 如 果 我 们 针对 它 应 用 定理 6.3 中 的 构造 方法 ， 
将 能 够 得 到 新 的 文法 C 并 满足 LG) = L(G)- {和}。 
14. 给 出 一 个 文法 实例 ， 说 明 在 消除 4 产生 式 后 引入 了 以 前 不 存在 的 单位 产生 式 的 情况 。 者 
15. 设 G 是 一 个 没有 4 产生 式 的 上 下 文 无 关 文 法 ， 但 可 能 存在 单位 产生 式 ， 通 过 它 证 明定 理 6.4 
的 构造 方法 不 会 引入 4 产生 式 。 
: 证明: 如 果 一 个 文法 不 存在 和 产生 式 与 单位 产生 式 ， 则 根据 定理 6.2 中 的 构造 方法 ， 在 消除 
无 用 产生 式 的 过 程 中 不 会 引入 这 些 形式 的 产生 式 。 获 
.验证 定理 6.4 证 明 中 的 命题 : 变量 B 在 它 一 出 现时 就 可 以 被 替换 。 
.假定 上 下 文 无 关 文法 G = (V, 7, 5, P) 中 存在 一 个 如 下 形式 的 产生 式 
A—xy 
其 中 x, yE(VU7T)*， 试 证 明 如 果 该 产生 式 被 
A—By 


个 


一 ”一 
oo -~ 


B—x 


替换 ， 其 中 BgV， 则 得 到 的 新 文法 与 原文 法 是 等 价 的 。 
19. 考虑 定理 6.2 中 用 于 消除 无 用 产生 式 的 方法 ， 颠 倒 其 两 个 部 分 的 顺序 ， 也 就 是 先 消除 8 不 能 
到 达 的 变量 ， 然 后 消除 那些 不 会 生成 终结 符 串 的 变量 。 则 采用 这 一 新 的 方法 是 否 可 行 》 如 





上 下 区 无 类 区 法 的 化 商 与 范式 111 


果 可 行 ， 证 明之 ， 否 则 给 出 一 个 反例 。 
20. 通过 介绍 文法 复杂 性 的 概念 ， 我 们 有 可 能 给 出 化 简 的 准确 定义 。 针 对 复杂 性 ， 存 在 多 种 的 
定义 方法 ， 其 中 一 种 就 是 考虑 所 有 产生 式 中 所 有 符号 串 的 长 度 ， 比 如 ， 我 们 可 以 使 用 
complexity(G) = > {1+1v)} 


作为 复杂 性 定义 。 基 于 这 种 定义 ， 试 说 明 消除 无 用 产生 式 总 是 能 够 降低 复杂 性 的 ， 并 给 出 
消除 A 产生 式 以 及 单位 产生 式 对 复杂 性 的 影响 。 
21. 对 于 给 定语 言 L 的 上 下 文 无 关 文 法 G 以 及 G 的 任意 等 价 形式 GG， 如 果 complexity(G) < 
complexity(G)， 则 G 是 最 小 的 。 通 过 实例 说 明 消 除 无 用 产生 式 并 不 必然 生成 最 小 文法 。 狠 
友 22. 证 明 : 设 G = (V, 7T, $, P) 是 一 个 上 下 文 无 关 文 法 ， 将 其 中 左 部 给 定 变量 (比如 4) 的 产 
生 式 集合 分 成 两 个 不 相交 的 子 集 
A—AxilAxs|-…|Ax, 
和 


A—yilysl |y,, 
其 中 x, y,;E(VUT)"， 且 4 不 是 任何 y, 的 前 缀 。 考 虚 文 法 G=(VU{ 必 ,7T,5,P)， 其 中 Zg&V 有 及 
是 通过 采用 
A—yly,Z, i= 1,2,.…,m 
Z—xx2, i=1,2,.…,n 
替换 所 有 4 在 左边 的 产生 式 而 得 到 的 。 则 LG) = L(G)。 
23. 使 用 习题 22 的 结论 重 写 文法 
A—AalaBc|A 
B—Bblbc 
使 得 它 不 再 存在 形 如 4 一 4x 或 者 B->Bx 的 产生 式 。 
友 24. 将 左边 包含 变量 4 的 产生 式 集 合 分 成 两 组 不 相交 的 子 集 
A—>xiAlx,A|:…|x,A 
和 
4 一 yy …|>m 
其 中 4 不 是 任意 y 的 后 级 。 证 明 通 过 将 这 些 产生 式 用 
A—ylZy;,, i= 1,2,.…,m 
Z—>x2Zx,, i=1,2,.…,n 
替换 而 得 到 的 文法 与 原文 法 等 价 。 


6.2 两 个 重要 的 范式 


针对 上 下 文 无 关 文法 ， 我 们 可 以 建立 多 种 类 型 的 范式 ， 其 中 一 些 由 于 它们 广泛 的 用 途 而 
被 深入 研究 ， 本 节 我 们 将 简单 介绍 其 中 的 两 种 。 


CD 
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6.2.1 乔 姆 斯 基 范 式 
我 们 将 看 到 ， 存 在 一 种 类 型 的 范式 ， 其 中 产生 式 右 部 的 符号 数目 是 严格 限制 的 。 特 别 地 ， 
我 们 可 以 限制 产生 式 右 部 的 符号 数 不 超过 两 个 ， 这 种 形式 的 一 个 实例 即 是 乔 姆 斯 基 范 式 。 
定义 6.4 如 果 一 个 上 下 文 无 关 文 法 的 所 有 产生 式 都 形 如 


4 一 BC 
或 
A—a 
其 中 ，A, B,C 属于 V，a 属 于 T。 则 该 文法 属于 乔 姆 斯 基 范 式 。 
例 6.7 文法 
S—ASla 
A—SA|b 
是 乔 姆 斯 基 范 式 ; 而 文法 
S 一 48|445 
4 一 S4|aa 
不 是 ， 因 为 产生 式 $ 一 44$ 和 4 一 ae 与 定义 6.4 中 的 条 件 发 生 冲 突 。 口 


定理 6.6 对 于 任意 的 上 下 文 无 关 文 法 G = (V, T, 8, P) 其 中 MGL(G)， 都 存在 一 个 等 价 的 上 
下 文 无 关 文 法 侣 =(V,T 了 ,5S, 户 ) 属 于 乔 姆 斯 基 范 式 。 
证 明 : 根据 定理 6.5， 不 失 一 般 性 地 ， 可 以 假定 文法 G 中 没有 和 产生 式 与 单位 产生 式 。 则 的 构 
造 过 程 包括 如 下 两 个 步骤 : 
步骤 1 根据 文法 G 构 造 文法 G, = (V1, 7, 5, P) 。 首 先 考察 P 中 形 如 
一 XI (6-5) 


的 产生 式 ， 其 中 每 个 x 都 是 V 或 者 7 中 的 符号 。 如 果 n=1， 由 于 不 存在 单位 产生 式 ， 则 x 必然 是 
一 个 终结 符 。 在 这 种 情况 下 ， 将 该 产生 式 加 到 Pl 中 。 如 果 n > 2， 那 么 对 于 每 一 个 aeT， 引 入 新 
的 变量 B。。 对 于 P 中 所 有 形 如 式 (6-5) 的 产生 式 ， 我们 在 Pi 中 加 入 产生 式 


4 一 CIC)…C， 
其 中 
Ci=t 车 在 V 中 
且 
C=B, 若 ,=a 
对 于 每 一 个 B.， 我 们 也 将 在 已 中 加 入 产生 式 
Bsa 


算法 的 这 一 步 消除 了 右 部 长 度 大 于 1 的 产生 式 中 的 所 有 终结 符 , 并 用 新 引入 的 变量 来 替换 它们 。 
通过 这 一 步骤 ， 我 们 将 得 到 文法 G,， 其 中 的 产生 式 形 如 
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A—a (6-6) 
或 
A—C1C,…C, (6-7) 
其 中 CEV,， 
根据 定理 6.1， 很 容易 得 到 
L(G,) = L(G) 


步 又 2: 在 第 2 步 中 ， 通 过 引入 新 的 变量 来 减少 产生 式 右 部 的 长 度 ， 首 先 我 们 将 所 有 形 如 式 
(6-7) 且 n=2 的 产生 式 和 形 如 式 (6-6) 的 产生 式 加 到 户 中 。 对 于 n> 2 的 产生 式 ， 我 们 引入 新 
变量 DD， D,, 四 并 将 产生 式 


4 一 CD 
Di 一 C2D: 


站 :一 n-1Cn 


加 到 户 中 。 显 然 ， 最 后 得 到 的 结果 文法 G 是 乔 姆 斯 基 范 式 。 重 复 应 用 定理 6.1 可 以 得 到 L(G,) = 
L(G) ， 因 而 


L(G) = L(G) 


上 述 证 明 过 程 并 不 规范 ， 但 很 容易 给 出 更 加 准确 的 证 明 ， 我 们 将 这 一 工作 留 给 读者 。 重 


例 6.8 将 具有 产生 式 
S—ABa 
A—aab 
B~—>Ac 


的 文法 转换 成 乔 姆 斯 基 范 式 。 


该 文法 满足 定理 6.6 的 构造 条 件 ， 不 存在 4 产生 式 与 单位 产生 式 。 
第 一 步 ， 我 们 引入 新 的 变量 B,, B,, B.， 并 通过 应 用 上 述 算法 可 以 得 到 
Ss—ABB, 
A—B,B.B, 
B—AB. 
B.—a 
B,—b 


B.—c 


第 二 步 ， 通 过 引入 另外 的 变量 将 上 步 得 到 的 前 两 个 产生 式 转换 成 范式 ， 这 样 得 到 的 最 终 


结果 如 下 : 


S—AD, 
Di->BB， 
A—B,D, 
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D,—B.B, 
B—AB. 
B—a 
B,—b 
B.—c 总 


6.2.2 格 里 巴克 范式 


另 一 种 有 用 的 文法 形式 是 格 里 巴克 范式 。 它 不 是 限制 产生 式 右 部 的 长 度 ， 而 是 限制 终结 
符 与 变量 可 以 出 现 的 位 置 。 验 证 格 里 巴克 范式 的 证 明 过 程 相 对 比较 复杂 并 且 不 是 很 明显 。 类 
似 地 ， 对 给 定 的 上 下 文 无 关 文法 构造 与 其 等 价 的 格 里 巴克 范式 也 是 一 个 村 燥 的 过 程 。 因 此 这 
里 我 们 只 做 简要 的 介绍 ， 但 格 里 巴克 范式 有 很 多 理论 与 实践 性 的 结论 。 

定义 6.5 对 于 一 个 上 下 文 无 关 文 法 ， 如 果 其 所 有 的 产生 式 都 具有 如 下 形式 


A—ax 


其 中 aET 且 xEV ， 则 它 属于 格 里 巴克 范式 。 
通过 与 定义 5.4 比 较 ， 我 们 可 以 着 出 4A~>ax 的 形式 在 简单 文法 与 格 里 巴克 范式 中 是 相同 的 ， 
但 在 格 里 巴克 范式 中 ， 没 有 限制 (4, a) 对 只 能 出 现 一 次 。 这 种 形式 上 的 自由 使 得 格 里 巴克 范 
式 具 有 简单 文法 所 没有 的 一 般 性 。 
如 果 一 个 文法 不 是 格 里 巴克 范式 ， 则 我 们 可 以 运用 前 述 学 习 的 一 些 技巧 来 重 写 文 法 使 之 
满足 格 里 巴克 范式 的 要 求 。 这 里 将 给 出 两 个 简单 的 例子 。 
例 6.9 文法 
S—AB 
A—aAlbBlb 
Bb 


不 是 格 里 巴克 范式 ， 但 通过 运用 定理 6.1 中 的 替换 方法 ， 我 们 可 以 直接 得 到 属于 格 里 巴克 范式 
的 等 价 形式 


S—>aABIbBBIbB 
A—aAlbBlb 
B-—>b 口 
例 6.10 将 文法 
S—abSblaa 
转换 成 格 里 巴克 范式 。 


这 里 我 们 可 以 采用 与 构造 乔 姆 斯 基 范 式 类 似 的 方法 ， 首 先 引入 变量 4 和 有 ， 它 们 在 实际 含 
义 上 分 别 与 < 和 bj 是 相同 的 。 这 样 通过 将 原 产生 式 中 的 终结 符 替 换 成 相应 的 变量 即 可 以 得 到 属 
于 格 里 巴克 范式 的 等 价 文法 。 
S—aBSBlaA 
A—a 
B—b 口 
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一 般 来 说 ， 对 给 定 的 文法 ， 将 其 转换 成 格 里 巴克 范式 或 进行 相应 的 证 明 都 不 是 简单 的 事 
情 。 但 通过 引入 格 里 巴克 范式 ， 可 以 使 下 一 章 中 一 个 重要 结论 的 技术 讨论 大 大 简化 。 然 而 从 
概念 的 角度 出 发 ， 格 里 巴克 范式 在 我 们 的 讨论 中 并 没有 起 到 更 进一步 的 作用 ， 因 此 这 里 我 们 
只 是 简单 地 给 出 它 的 相关 结论 而 没有 提供 证 明 。 

定理 6.7 对 于 每 一 个 A 履 L(G) 的 上 下 文 无 关 文法 G， 都 存在 一 个 与 其 等 价 的 属于 格 里 巴克 
范式 的 文法 全。 


习题 


1. 给 出 定理 6.6 的 详细 证 明 过 程 。 
2. 给 出 文法 5->aSblab 的 乔 姆 斯 基 范 式 。 
3. 给 出 文法 S->aSa4|4，4->ap4 人 | 的 乔 姆 斯 基 范 式 。 


4. 给 出 文法 
S—abAB 
A—bAB|A 
B—>BAa|A|A 

的 乔 姆 斯 基 范 式 。 

5. 给 出 文法 
S—ABlaB 
A—aab|A 
B-—>bbA 


的 乔 姆 斯 基 范 式 。 铝 
. 设 G = (V, 7, 5, P 是 任意 一 个 没有 单位 产生 式 或 4 产生 式 的 上 下 文 无 关 文 法 ， 设 k 为 P 中 产生 
式 右 部 符号 数目 的 最 大 值 。 证 明 存 在 一 个 等 价 的 乔 姆 斯 基 范 式 ， 使 得 它 的 产生 式 规则 数目 
不 超过 全- DIP| + |7l|。 
. 画 出 习题 4 中 文法 的 依赖 图 。 
. 如 果 一 个 语言 存在 线性 文法 ， 则 称 之 为 线性 语言 (定义 见 例 3.13)。 设 L 是 不 包含 4 的 线性 语 
言 ， 证 明 存在 一 个 文法 G = (V, 7, $, P)， 它 的 产生 式 具有 如 下 的 某 种 形式 

A—aBb 

4 一 Ba 


A—a 


修 


% + 


其 中 aET, 4, BEV， 满 足 L=L(G)。 饮 170 
.证 明 对 于 任意 的 上 下 文 无 关 文 著 G = (V, T, 5, P) 都 存在 一 个 等 价 的 上 下 文 无 关 文 靶 形 式 ， 

其 产生 式 形 如 A 一 aBC 或 4 一 4， 其 中 aEFU{4}, 4,B,CEV， 者 

10. 给 出 文法 


© 


S~—>aSblbSalalb 


的 格 里 巴克 范式 。 
11. 给 出 文法 
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S—aSblab 
的 格 里 巴克 范式 。 
12. 给 出 文法 
S—ablaSlaaS 
的 格 里 巴克 范式 。 震 
13. 给 出 文法 
S$—»ABbla 
4 一 aa4|B 
B—>bAb 
的 格 里 巴克 范式 。 


14. 是否 每 一 个 线性 文法 都 能 够 转换 成 这 样 一 种 形式 : 产生 式 形 如 4 一 ar， 其 中 aET， 
XEVU{A}。 
15. 如 果 一 个 上 下 文 无 关 文 法 的 所 有 产生 式 满 足 如 下 模式 
A—aBC 
A—=aB 
A—a 
其 中 aET, 4, 8, CEV， 则 该 文法 属于 双 标 准 式 。 
根据 双 标 准 式 的 定义 ， 将 文法 G = ({5, 4, B,C}, {a,5}, 5, 了) 转换 成 双 标 准 式 ， 其 中 有 为 
S—aSA 
A—bABC 
B->b 
CaBC 乔 


友 16. 证 明 双 标 准 式 的 一 般 性 ， 即 对 于 任意 的 上 下 文 无 关 文 法 G 且 hEL(G)， 都 存在 一 个 等 价 的 
文法 满足 双 标 准 式 。 


6.3 上 下 文 无 关 文法 的 成 员 资格 判定 算法 * 


在 5.2 节 中 ， 我 们 已 经 指出 ， 如 果 没 有 采用 特别 的 策略 ， 基 于 现 有 上 下 文 无 关 文 法 的 成 员 
资格 判定 算法 和 分 析 算 法 需要 [wi 步 才能 完成 符号 串 w 的 分 析 。 现 在 我 们 将 验证 这 一 命题 。 这 
里 我 们 描述 的 算法 称 为 CYK 算 法 ， 它 是 根据 其 提出 者 J. Cocke，D. H. Younger 和 T. Kasami 进 
行 命名 的 。 使 用 该 算法 的 一 个 前 提 条 件 是 上 下 文 无 关 文 法 必须 满足 乔 姆 斯 基 范 式 ， 它 是 通过 
将 一 个 问题 采用 如 下 方法 分 解 成 一 系列 的 小 问题 来 实现 的 。 给 定 文法 G = (V, T, 5, P)， 它 满足 
乔 姆 斯 基 范 式 ， 对 于 符号 串 


w = Qi02pG， 


我 们 定义 其 子 串 
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以 及 V 的 子 集 
Vj= {AEV:4 >w,} 

显然 ，wEL(G) 当 且 仅 当 SEV,。 

为 了 计算 V， 注意 到 AEV 当 上 且 仅 当 G 中 存在 产生 式 4 一 a;。 因 此 对 于 1 < i<n 的 所 有 V;， 可 
以 通过 检测 w 和 文法 中 的 所 有 产生 式 来 计算 。 接 下 来 ， 注 意 由 于 /> i，4 能 推导 出 ws 当 且 仅 当 
存在 产生 式 4 一 BC， 其 中 对 于 某 个 FE (i<k,k< 站 ，B wx 且 C 避 wi ,1j。 换 句 话说 ， 

多 = U {4:4 一 BC, 其 中 BEV,CEV,)} 
AGE 六 二 | (6-8) 

通过 对 式 (6-8) 中 下 标的 检查 ， 可 以 发 现 按照 如 下 的 顺序 类 推 ， 能 够 计算 出 所 有 的 V; 

1. 计算 Vi， V,, "7, Vn 

2. 计算 Vi,， Ya 

3. 计算 Vi;， V24，…， Van 


等 等 。 
例 6.11 确定 符号 串 w= aappp 是 否 属于 由 文法 
S—AB 
4 一 5BB|a 
B-—>AB|b 
生成 的 语言 。 


首先 注意 到 wi! = a， 因 而 Vi 是 所 有 能 够 直接 推导 出 a 的 变量 的 集合 ， 也 就 是 说 ，Vil = {4}。 
同样 ， 由 于 wz = a， 我 们 也 可 以 得 到 V,, = {4A}。 
类 似 地 ， 可 以 得 到 
Vi = {4}, Vs = {4}, Vs = {8B}, Va = {B}, Vss = {B} 
现在 可 以 应 用 式 (6-8) 计算 
Vis= {A : A—BC, BEV,, CEV,,} 
由 于 Vi = {4}，Vz = {4}， 该 集合 由 所 有 右 部 为 44 的 产生 式 的 左 部 变量 组 成 。 由 于 不 存在 这 
样 的 产生 式 ， 所 以 Vi; 为 空 ， 接 下 来 计算 
Vs = {A :4 一 BC, BE CEV,;} 
它 要求 产 生 式 的 右 部 是 4B， 因 此 我 们 可 以 得 到 V,, = {5, B}， 依 此 类 推 我 们 将 得 到 
Ya = 8, Vs = {5, B}, V3a = {A}, Vas = {A} 
Vi3= {5$, B}, Va = {4A}, V3s = {S$, B} 
Vi = {A}, Vs = {5,B} 
Vis = {S$, B} 
因此 wEL(G)。 口 
上 述 的 CYK 算 法 可 以 用 于 确定 由 乔 姆 斯 基 范 式 生 成 语言 的 成 员 资 格 。 通 过 更 多 地 了 解 元 
素 风 是 怎样 被 推导 出 来 的 ，CYK 算 法 可 以 转换 成 一 个 分 析 方法 。 可 以 看 出 CYK 算 法 需要 OUa) 


MD 
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步 ， 注 意 只 有 n(n + 1)/2 个 Vi 的 集合 需要 计算 。 并 且 它 们 中 的 每 一 个 在 式 (6-8) 中 至 多 涉及 nn 
个 项 目的 求 值 ， 因 此 结论 成 立 。 
习题 
1. 使 用 CYK 算 法 确定 符号 串 aabb，aabba 以 及 abbbb 是 否 属于 由 例 6.11 给 出 的 文法 生成 的 
语言 。 
2. 根据 例 6.11 中 的 文法 ， 使 用 CYK 算 法 找到 符号 串 aab 的 分 析 。 各 
3. 根据 习题 ?中 采用 的 方法 证 明 CYK 算 靶 可 以 转换 成 一 个 分 析 方 法 。 
友 克 4. 使 用 习题 3 的 结果 写 一 个 计算 程序 ， 它 能 够 针对 所 有 具有 格 里 巴克 范式 的 上 下 文 无 关 文 
法 进行 语法 分 析 。 
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采用 上 下 文 无 关 文法 描述 上 下 文 无 关 语 言 是 方便 的 ， 在 程序 设计 语言 的 定义 中 使 用 BNF 
就 说 明了 这 一 点 。 针 对 上 下 文 无 关 语 言 的 下 一 个 问题 就 是 是 否 存在 一 类 自动 机 能 够 与 它 关 联 
起 来 。 在 前 面 的 讨论 中 ， 我 们 已 经 看 到 ， 有 穷 自动 机 并 不 能 识别 所 有 的 上 下 文 无 关 语 言 。 直 
观 上 ， 这 是 由 于 有 穷 自动 机 存在 严格 的 有 穷 存 储 限 制 ， 而 上 下 文 无 关 语 言 的 识别 可 能 需要 存 
储 没 有 边界 的 信息 。 例 如 ， 在 扫描 语言 = {a”b” :n>0} 中 的 一 个 符号 串 时 ， 不 仅 需 要 检查 所 
有 在 第 一 个 2 之 前 的 ae， 而 且 必 须 记 录 a 的 个 数 ; 同时 由 于 n 是 无 限 的 ， 使 得 这 种 计数 不 能 在 有 
穷 的 存储 中 完成 ， 因 此 我 们 需要 一 种 能 够 无 限 计 数 的 机 器 。 而 从 另外 一 个 例子 ， 比 如 {ww 中 中 
可 以 看 出 ,仅仅 有 无 限制 计数 的 能 力 还 是 不 够 的 ， 它 还 需要 能 够 逆序 地 存储 并 匹配 一 个 符号 
序列 ， 这 表明 我 们 可 以 尝试 使 用 栈 作为 存储 机 制 ， 并 允许 以 与 栈 类 似 的 方式 操作 无 限 的 存储 。 
这 样 我 们 就 可 以 得 到 一 类 称 之 为 下 推 自动 机 (pushdown automata, pda) 的 机 器 。 

在 这 一 章 中 ， 我 们 将 介绍 下 推 自动 机 与 上 下 文 无 关 语言 之 间 的 联系 。 我 们 首先 证 明 如 果 
允许 下 推 自动 机 以 非 确定 型 的 方式 工作 ， 那 么 就 能 够 得 到 恰好 可 以 接受 上 下 文 无 关 语 言 族 的 
自动 机 类 。 但 同时 我 们 也 将 看 到 ， 它 不 再 存在 一 种 确定 型 的 等 价 形式 。 确 定型 下 推 自动 机 类 
定义 了 新 的 语言 族 ， 即 确定 型 上 下 文 无 关 语 言 ， 它 是 上 下 文 无 关 语 言 的 一 个 真子 集 。 在 程序 
设计 语言 的 处 理 中 ， 确 定型 上 下 文 无 关 语 言 是 一 个 重要 的 语言 族 ， 所 以 我 们 将 通过 与 确定 型 
上 下 文 无 关 语 言 对 应 的 文法 的 简要 介绍 来 结束 本 章 。 


7.1 非 确定 型 下 推 自动 机 


图 7-1 给 出 了 下 推 自 动机 的 图 示 。 其 中 ， 控 制 部 件 的 每 一 次 迁移 都 将 从 输入 文件 中 读 入 一 
个 字符 ， 同 时 通过 常规 的 栈 操作 来 改变 栈 的 内 容 。 控 制 部 件 的 每 一 次 迁移 都 是 由 当前 输入 符 
号 和 当前 栈 顶 符号 同时 决定 的 。 而 迁移 的 结果 将 导致 控制 部 件 状 态 以 及 栈 顶 符号 发 生 改 变 。 
在 本 章 中 ,我 们 的 讨论 只 限于 可 以 作为 接受 器 的 下 推 自动 机 。 


输入 文件 





控制 部 件 
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7.1.1 下 推 自动 机 的 定义 


通过 对 直观 表示 的 形式 化 ， 我 们 将 得 到 下 推 自动 机 的 一 个 准确 定义 。 
定义 7.1 非 确定 型 下 推 接 受 器 (nondeterministic pushdown accepter, npda) 由 一 个 七 元 组 
定义 
M=(0,>,T,6, go,7z,F) 


其 中 ，@ 是 控制 部 件 内 部 状态 的 有 穷 集 ; 
是 输入 字母 表 ， 
I 是 一 个 有 穷 符 号 集 ， 称 为 栈 字 母 表 (stack alphabet ); 
6:Qx(ZU{4))xT 一 QO x 的 有 穷 子 集 ， 称 为 转移 函数 ; 
40oEQ 是 控制 部 件 的 初始 状态 ; 
ZEI 是 栈 开 始 待 〈stack start symbol); 
CO 是 终止 状态 集合 。 

6 的 定义 域 与 值 域 采用 的 复杂 形式 化 表示 便于 封闭 性 检查 。56 的 参数 是 控制 部 件 的 当前 状 
态 、 当 前 输入 符号 以 及 当前 栈 顶 符号 ，6 的 返回 结果 是 对 集合 (gq, x)， 其 中 g 是 控制 部 件 的 下 
一 个 状态 、x 是 用 于 替换 原单 个 栈 顶 符号 的 符号 申 。 注 意 到 6 的 第 二 个 参数 可 以 是 *， 它 表明 自 
动机 的 一 次 迁移 可 以 不 需要 输入 符号 ， 我 们 称 之 为 4 转移 。 同 时 根据 定义 ，6 的 执行 总 需要 一 
个 栈 符 号 ， 如 果 栈 为 空 ， 则 相应 的 转移 将 无 法 完成 。 最 后 一 点 ， 定 义 中 对 6 的 值 域 为 一 有 穷 子 
集 的 要 求 是 必要 的 ， 这 是 由 于 Q x 工 是 一 无 穷 集 合 因而 也 就 存在 无 穷 子 集 。 而 当 npda 存 在 几 种 
迁移 选择 时 ， 则 这 一 选择 必须 限制 到 一 有 穷 可 能 性 集合 中 。 

例 7.1 假定 一 个 npda 的 转移 规则 集合 包含 

6d(q1, a, b) = {(g2, cd), (qs, O)} 


如 果 某 一 时 刻 ， 控 制 部 件 的 状态 是 9 ， 输 入 符号 是 ae， 当 前 的 栈 顶 符号 是 有 ， 则 可 能 出 现 两 种 
情况 中 的 一 种 : (1) 控制 部 件 进入 状态 9;， 用 符号 串 cd 替换 栈 顶 符 号 5， 或 者 (2) 控制 部 件 
进入 状态 9;， 其 中 栈 顶 符号 5 被 删除 。 在 表示 法 中 ， 我 们 假定 向 栈 中 插入 一 个 符号 串 的 操作 是 
从 符号 串 的 右 端 开 始 逐 个 完成 的 。 口 
例 7.2 考虑 某 一 npda， 其 中 

Q = {qo0, 91, 92, 93} 

> = {a,b} 

T= {0,1} 

z=0 

F = {gq;} 
并 且 


dgo, a, 0) = {(q1, 10), (gs, A)} 
6(qo, 4, 0) = {(gs, 4)} 

6d(q1, a, 1) = {(qi, 11)} 

(qi, b, 1) = {(gq,, A)} 
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dq,, b, 1) = {(q, 1)} 
6(g,, A,0)= {(93， A)} 
那么 ， 该 自动 机 是 如 何 工作 的 ? 
首先 ， 我 们 注意 到 并 不 是 输入 符号 与 栈 符号 的 所 有 可 能 组 合 都 在 转移 函数 中 做 了 定义 。 
比如 ， 对 6(qo, 5, 0)， 就 不 存在 相应 的 入 口 。 这 与 非 确定 型 有 穷 状 态 自 动机 的 情形 是 相同 的 ， 
一 个 没有 定义 的 转移 函数 其 值 为 空 集 合 ， 而 在 apda 中 它 表 示 死 格局 。 
上 述 npda 中 的 关键 转移 是 : 
dqi, a, 1) = {(qi1, 11)} 


它 表 示 当 自动 机 读 到 a 时 ， 在 栈 顶 增加 一 个 1; 以 及 

6(q,, b, 1) 二 {(q2, A)} 
它 表 示 读 到 b 时 从 栈 顶 删除 一 个 1。 这 两 步 转移 分 别 完成 对 a 的 计数 以 及 a 的 个 数 与 对 b 个 数 的 匹 
配 。 控 制 部 件 一 直 保 持 状态 4q, 直 到 碰 到 第 一 个 5，， 此 时 进入 状态 9,， 这 就 保证 了 晤 后 一 个 a 之 前 
没有 任何 bp。 通 过 分 析 其 他 转移 函数 ， 我 们 将 看 到 当 且 仅 当 输入 符号 串 在 语言 

L={ab’:n20}Utf{a} 
中 时 ，npda 才 将 以 最 终 状 态 q; 结 束 。 

与 有 穷 自 动机 类 似 ， 我 们 可 以 说 该 npda 能 够 接受 上 述 语 言 。 当 然 ， 在 给 出 这 样 一 个 命题 
之 前 ， 我 们 需要 首先 定义 npda 能 够 接受 一 个 语言 的 具体 含义 。 口 
为 了 简化 讨论 ， 我 们 引入 一 种 方便 的 表示 法 ， 它 用 于 描述 一 个 npda 在 处 理 一 个 符号 串 的 
过 程 中 经 历 的 连续 格局 。 它 涉及 的 相关 因素 包括 某 一 时 刻 控制 部 件 的 当前 状态 ， 输 入 符号 串 
的 未 读 人 部 分 以 及 当前 的 栈 内 容 。 综 合 这 些 因素 就 完全 决定 了 npda 所 能 够 进行 处 理 的 金 部 可 
能 途径 。 设 有 三 元 组 
(q, w, u) 

其 中 ，g 是 控制 部 件 的 状态 ，w 是 输入 符号 串 的 未 读 人 部 分 ，u 是 栈 的 当前 内 容 (最 左边 的 符号 
表示 栈 项 符号 ) ， 我 们 称 该 三 元 组 为 下 推 自动 机 的 醉 时 描述 (instantaneous description)。 从 一 
个 瞬时 描述 到 另 一 个 瞬时 描述 的 迁移 采用 符号 上 -来 表示 ; 这 样 ， 

(gi, aw, bPOF- (gq,, w, yx) 
当 且 仅 当 

(gz2, 7)E6(09 a, b) 


才 是 可 能 的 。 

包含 任意 多 个 步骤 的 迁移 ， 可 以 用 上 表示 。 在 存在 多 个 自动 机 的 情况 下 我 们 将 采用 Fw 裘 明 
该 迁移 是 由 特定 自动 机 M 完 成 的 。 

7.1.2 下 推 自动 机 接受 的 语言 


定义 7.2 设 MM 二 (@， 之 ， 工 ， 0， go, Z， A) 为 一 非 确 定型 下 推 自 动机 ， 则 MM 接受 的 语 喜 言 是 集合 
L(M) = {wEZ : (go, mw,z)ENP, A, Wu), pEF, uET} 
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总 之 ， 由 导 接 受 的 语言 就 是 所 有 这 些 蔡 号 囊 的 集合 ， 它 们 部 能 够 在 结 玉 接 受 符号 中 时 将 M 下 为 
终 态 。 而 栈 的 最 终 内 容 4 与 这 种 接受 形式 的 定义 是 无 关 的 。 
例 7.3 针对 语言 
L= {wE{a, by : no(w) = ns(w)} 


构造 一 个 npda。 

在 例 7.2 中 ， 针 对 这 一 问题 的 解决 方案 涉及 a 与 bp 的 计数 ， 这 点 很 容易 用 栈 完成 。 同 时 ， 这 
里 我 们 不 需要 考虑 a 与 5 的 顺序 问题 ， 因 而 可 以 在 读 到 一 个 a 时 插入 一 个 计数 器 符号 (比如 0) 
到 栈 中 ， 在 读 到 一 个 bp 时， 就 从 栈 中 弹出 一 个 计数 器 符号 。 这 样 做 存在 的 一 个 难题 是 :如 果 w 
的 一 个 前 绎 中 a 的 个 数 比 b 的 个 数 少 ， 则 在 栈 中 将 找 不 到 足够 的 0 来 完成 转移 。 为 了 解决 这 一 问 
题 ， 我 们 可 以 采用 一 个 负 计数 器 符号 〈 比 如 1) 用 于 对 还 没有 与 匹配 的 65 计数。 这 样 得 到 的 完 
整 解决 方案 就 是 一 个 npda M = ({go, gj}，{a, 里 ,{0, 1,z}, 6, qo, z, {97j})， 其 中 6 为 


go,A,z) = {(gn 7)} 
qo, a, z) = {(qo0, 0z)} 
dqo, b, z) = {(qo, 17)} 
(qo, a, 0) = {(qo, 00)} 
go, b, 0) = {(go, PO)} 
go, a, 1) = {(qo, 0)} 
qo, b, 1) = {(qo, 11)} 


在 处 理 符号 串 baab 的 过 程 中 ， 该 npda 能 够 执行 如 下 的 迁移 


(go, paap,z)HF(qo aab, 1z)F- (qo, ab, z) 
HF-(qo, b, 0z)H (go, A, oF (gy, 4, z) 


因此 该 符号 串 可 以 被 接受 。 口 
例 7.4 构造 一 个 npda 能 够 接受 语言 
L= {ww : wE{a, b}'} 


我 们 将 运用 这 样 的 一 个 事实 : 通过 栈 能 够 得 到 与 插入 顺序 相反 的 符号 。 当 读 取 符号 串 的 第 一 
部 分 时 ， 我 们 在 栈 中 压 人 连续 的 符号 。 对 于 第 二 部 分 ， 我 们 比较 当前 符号 与 栈 顶 符号 ， 只 要 
它们 匹配 就 一 直 进 行 下 去 。 由 于 从 栈 中 获取 的 符号 与 其 插入 的 顺序 相反 ， 因 此 当 旦 仅 当 输 入 
形式 为 ww 时 ， 才 能 得 到 一 个 完全 的 匹配 。 
上 述 方案 中 ， 一 个 明显 的 难点 是 我 们 并 不 知道 符号 串 的 中 间 位 置 ， 也 就 是 w 结 束 和 ws 开始 

的 地 方 。 但 是 自动 机 的 非 确定 型 特性 可 以 帮助 我 们 解决 这 一 问题 ;: npda 可 以 正确 地 猜测 中 间 
位 置 并 转换 状态 。 这 样 ， 针 对 该 问题 的 解决 方案 是 : M = (2,2,T, 6, go,z,F)， 基 中 

Q = {q0, 41, 92} 

> = {a,b} 

T= {a,b, z} 

F = {gq} 
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它 的 转移 函数 可 以 分 成 几 个 部 分 : 在 栈 中 压 入 w 的 转移 函数 集合 
dqo, a, a) = {(qo, aa)} 
0(qo, b, a) = {(qo, ba)} 
(qo, a, b) = {(qo, ab)} 
Kgqo, b, b) = {(qo, bb)} 
qo, a, z) = {(qo, 4az)} 
(qo, b, z) = {(qo, bz)} 


猜测 符号 串 中 间 位 置 的 转移 函数 集合 (其 中 npda 的 状态 从 qo 转 至 g, ) 为 
dqo, 4, a) = {(q1, a)} 
6(qo, 4, 5b) = {(qi, b)} 
栈 中 内 容 匹 配 w 的 转移 国 数 集合 为 
2009 a, a) = {(qi, A)} 
6(q1, b, b) 三 {(qi, A)} 


最 后 
qi, A, 2) = {(q,, z)} 
可 用 于 识别 一 个 成 功 的 匹配 。 
上 述 自 动机 接受 abba 的 迁移 序列 为 : 
(qo, abba, z)H- (qo, bba, az)H- (qo, ba, baz) 
F(gqi, ba, baz)H- (qi1, a, az)H- (qi, 4, z)H- (gq,, z) 


针对 符号 串 中 间 位 置 定 位 的 非 确定 型 选择 在 第 三 个 迁移 中 完成 。 在 这 一 阶段 ，pda 的 瞬时 
描述 为 (qo, ba, baz)， 并 且 对 下 一 步 迁 移 存 在 丙种 选择 :一 种 是 运用 6(go, b, b) = {(gu, bb)} 并 
执行 迁移 
(go, ba, baz)H- (go, a, bbaz) 


另 一 种 就 是 在 上 述 迁 移 序列 中 所 采用 的 ， 也 就 是 6(qo, 4, b) = {(q, b)}。 只 有 后 一 选择 才能 实 
现 输入 的 接受 。 口 


习题 


1. 构造 一 状态 数 少 于 4 的 pda， 使 得 它 能 够 接受 例 7.2 中 pda 所 接受 的 语言。 
2. 证 明 : 例 7.4 中 的 pda 不 能 接受 {ww*} 以 外 的 任何 符号 串 。 乔 
3. 构造 能 够 接受 下 列 正则 语言 的 npda: 

(a) Li = L(aaa’b) 

(b) L = L(aab‘aba’) 

(c) 二 与 上 ,的 并 

(d) Li 一 
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4. 构造 npda 能 够 接受 下 列 定义 在 2 = {a, b,c} 上 的 语言 : 
(DL= {fab”" :> 0 千 
(bD) L= {wcws:wE{fa, b}'} 
(cL= {ab”"c"*"”":n20,m20} 
(DL= fanpe+rncem :n>0,m>1} 
(e) L= {aib"c" :n>20} 
(DL= {fab":n<m<3n} 圳 
(BL={w:n(w)= nw) + 1} 
(h) L= {w :nw) = 2n,(w)} 
(DIL={w:n(w) + nw) = n(w)} 
(DL={w:2n(w) < ns(w) < 3n(w)} 
(KL= {w: nw) <n(w)} 
5. 构造 一 个 能 够 接受 语言 L = {a"b : n>20,nzm} 的 npda。 
6. 找 一 个 定义 于 5 = {a, b,c} 上 的 npda， 它 能 够 接受 语言 


L= {wicw, : wi, waEf{a, b}'; wi wr} 
7. 找 一 个 npda， 它 能 够 接受 由 L(a') 与 习题 6 中 语言 连接 而 得 到 的 语言 。 
8. 为 语言 L = {ab(ab)"b(ba)" : n> 0} 构 造 一 个 能 够 接受 它 的 npda。 
9. 是 否 存 在 一 个 dfa 接 受 的 语言 与 下 面 的 pda 所 接受 的 语言 相同 
M 三 ({qo, qi}, {a, b}, {2z}, 0， do， 2， {9q1}) 


其 中 


0(qo a, z) = {(q1, z)} 
dqo, b, z) = {(qo, 2)} 
qi,4, 7) = {(q1, 2)} 
6(q1,b,z) = {(go, 7) 者 


10. 什么 语言 能 够 被 pda 
M= ({qo, qi, 2, d3, 94， 95}， {a， b}, {0, 1 ， a}, 0， 40, 2Z， {qs}) 
接受 ? 其 中 
(qo, b, z) = {(q1, 1z)} 
dq, b, 1) = {(qi, 11)} 
dq;, a, 1) 三 {(93， A)} 


6(q;, a, 1) = {(qa, A)} 
0(94， 0， 2Z) 三 {(94， 2Z)， (95， z)} 


11. 给 出 由 npda Af = ({qo; qi, 92?}， {a， b}, {a, b, z}, 6, do, Z， {92}) 接受 的 语言 ， 它 的 转移 函数 定 
义 如 下 : ' 
dqo, a, 7) = {(q1, a), (9 A)} 
qi, b, a) 三 {(9)， b)} 
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6(qi, b, b) 三 {(9， b)} 
5(qi, a,b) = {(g2, 和 )} 莉 


12. 针对 例 7.3 中 的 npda， 如 果 FF= {qo, qj}， 给 出 由 该 自动 机 接受 的 语言 。 
13. 针对 习题 1 中 的 npda， 如 果 F = {go, gu 92}， 给 出 由 该 自动 机 接受 的 语言 。 
14. 给 出 一 个 能 够 接受 语言 L(aa*ba') 的 npda， 且 其 内 部 状态 不 超过 两 个 。 狗 
15. 假设 在 例 7.2 中 ， 我 们 用 

6(gq,, 人 ， 0) 三 {(gqo, 人 和)} 


替换 6(9:, 4, 0) 给 定 的 值 ， 给 出 这 个 新 pda 接受 的 语言 。 
16. 我 们 可 以 定义 一 个 受 限制 的 apda， 在 每 一 次 迁移 中 ， 它 将 至 多 在 栈 中 增加 一 个 符号 ， 改 变 
定义 7.1， 使 得 
6: Ox (FU{A}) xT->292*0ruruo) 


也 就 是 说 ，5 的 值 域 由 形 如 (9, ab), (qi, a) 或 (qi, 和) 的 对 集合 构成 。 证 明 对 任意 npda M 都 存 
在 这 样 一 个 受 限制 的 npda MY 满足 LCM) = LOM) 。 规 
17. 对 于 自动 机 是 如 何 接受 语言 的 ， 除 了 定义 7.2， 还 存在 另 一 种 形式 的 定义 ， 这 种 定义 要 求 : 
当 符 号 串 输 入 完毕 时 ， 栈 为 空 。 形 式 上 ， 如 果 其 满足 如 下 条 件 ， 则 npda 可 以 以 空 栈 方式 接 
受 语言 N(M)。 
NU = {wEY : (go w, OF np, A, PD)} 


其 中 p 是 中 的 任意 元 素 。 证 明 这 种 表示 方法 与 定义 7.2 是 等 价 的 ， 也 就 是 说 ， 对 于 任意 的 
npda M， 都 存在 一 个 npda MY 与 之 等 价 使 得 L(M) = NCM) ， 反 之 亦 然 。 


7.2 下 推 自动 机 与 上 下 文 无 关 语言 


在 前 一 节 的 例子 中 ， 我 们 可 以 看 到 ， 对 于 一 些 常 见 的 上 下 文 无 关 语言 存在 相应 的 下 推 自 
动机 ， 这 并 不 是 偶然 的 。 实 际 上 ， 在 上 下 文 无 关 语 言 与 非 确 定型 下 推 接受 器 之 间 存 在 着 普遍 
性 的 关系 ， 也 就 是 接 下 来 要 建立 的 两 个 主要 结论 。 我 们 将 证 明 ， 对 于 每 一 个 上 下 文 无 关 语言 
都 存在 一 个 npda 能 够 接受 它 ， 反 过 来 ， 任 何 npda 接 受 的 语言 都 是 上 下 文 无 关 语 言 。 


7.2.1 上 下 文 无 关 语 言 相 应 的 下 推 自动 机 


我 们 将 首先 证 明 ， 对 于 每 一 个 上 下 文 无 关 语 言 都 存在 一 个 npda 可 以 接受 它 。 基 本 思想 就 
是 构造 一 个 npda 能 够 以 某 种 方式 对 于 该 语言 中 任何 符号 串 产 生 一 个 最 左 推导 。 为 了 对 命题 稍 
做 简化 ， 我 们 可 以 假定 上 下 文 无 关 语言 是 由 格 里 巴克 范式 生成 的 。 

将 要 构造 的 pda 是 采用 如 下 方式 来 表示 推导 的 : 将 句 型 右 部 变量 压 人 栈 中 ， 而 使 完全 由 终 
结 符 组 成 的 左 部 作为 读 输 入 。 首 先 ， 我 们 将 开始 符 压 人 栈 中 ， 然 后 为 了 模拟 产生 式 4->axr， 必 
须 使 得 这 时 的 栈 顶 符号 为 变量 4， 输入 符号 为 终结 符 a。 模 拟 过 程 中 ， 栈 顶 符号 4 将 被 变量 申 x 
替换 。 我 们 将 很 容易 看 出 需要 什么 样 的 5， 才 能 得 到 这 样 的 结果 。 在 给 出 一 般 性 的 论证 之 前 ， 
我 们 首先 来 看 一 个 简单 的 例子 。 

例 7.5 构造 一 个 pda 能 够 接受 具有 如 下 产生 式 的 文法 生成 的 语言 : 


二 





S—aSbbla 
首先 我 们 将 该 文法 转换 成 格 里 巴克 范式 ， 得 到 的 新 产生 式 为 : 
S—asSAla 
A—bB 
B—b 
相应 的 自动 机 将 包含 三 个 状态 {qo, q1, 92} ， 其 中 go 为 初 态 ，9; 为 终 态 。 首 先 ， 开始 符号 5 将 通过 
转移 函数 
(go, 人 ， z) = {(qi1, Sz)} 
被 压 人 栈 中 。 当 从 输入 中 读 和 人 a 时 ， 在 pda 中 ， 通 过 将 8 替换 为 S4 来 模拟 产生 式 S->aS4。 类 似 
地 ， 规 则 5 一 a 将 导致 pda 读 入 一 个 a 同时 从 栈 顶 简单 地 删除 S$。 因 此 ， 这 两 个 产生 式 在 pda 中 表 
示 如 下 
dq, 0， $) 三 {(qi, $4), (gi, A)} 
类 似 地 ， 根 据 其 他 产生 式 将 得 到 
(qi, b, A) = {(qi, B)} 
6(qi, b, B) 三 {(q1, 人 和} 
如 果 栈 顶 为 开始 符 ， 则 表明 推导 完成 并 通过 
604， A， z) = {(g;, A)} 
将 pda 署 于 终 态 。 
针对 这 一 实例 的 构造 方法 同样 适用 于 其 他 情况 ， 可 以 得 出 一 个 普遍 性 的 结论 。 口 
定理 7.1 对 于 任何 的 上 下 文 无 关 语言 了 ， 看 在 一 个 npda M 使 得 
L=LM) 
证 明 : 如 果 L 是 一 个 无 4 的 上 下 文 无 关 语 言 ， 则 存在 一 个 生成 它 且 满足 格 里 巴克 范式 的 上 下 文 
无 关 文 法 。 设 G=(V, 7, 8, P) 是 这 样 的 文法 ， 根 据 它 我 们 构造 一 个 apda， 它 能 模拟 文法 中 的 最 
左 推导 。 如 上 所 述 ， 为 了 完成 模拟 ， 要 使 句 型 中 未 被 处 理 的 部 分 保留 在 栈 内 ， 同 时 使 名 型 的 
由 终结 符 组 成 的 前 绥 与 输入 符号 串 相 应 的 前 缀 匹配 。 
具体 地 ，npda 可 表示 为 : 
M= ({gqo, di, qr}, 1, VU{z}, 6, do, <， {qr}) 
其 中 zeY。 注意 MW 的 输入 字母 表 与 文法 G 的 终结 符 集合 相同 ， 栈 字母 表 包 括 文法 G 中 所 有 变量 
组 成 的 集合 。 
其 转移 国 数 将 包括 
(go, 人 ， 2z) 三 {(gi, Sz)} (7-1) 


它 使 得 M 在 第 一 次 转移 后 ， 栈 中 将 包含 推导 的 开始 符 5。( 其 中 栈 开 始 符 z 是 一 个 标志 ， 用 于 控 
测 推导 的 结束 。) 另外 ， 针 对 P 中 形 如 
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A—>au 
的 产生 式 ， 转 移 规则 集合 将 满足 
(qi, WEd(q1, a, A) (7-2) 
它 读 入 a， 并 将 栈 顶 的 变量 4 赫 换 成 x。 通 过 这 种 方法 生成 转移 函数 将 允许 pda 能 够 模拟 所 有 的 
推导 。 最 后 ， 我 们 将 通过 
604, 4, z) ={(qr 2)} (7-3) 
使 MH 进入 终 态 。 
为 了 证 明 M 能 够 接受 任意 的 wEL(G)， 考 虑 局 部 最 左 推导 
§ aiay…a Ahh A 
一 ai BA 
如 果 MM 能 够 模拟 这 一 推导 ， 则 在 读 入 aia，…as 后 ， 栈 中 一 定 包含 4,4,…A,,。 为 了 能 进行 下 一 步 
推导 ，G 中 必须 包含 产生 式 
Ai—bB1…B, 
而 根据 构造 方法 ， 可 知 M 中 存在 转移 规则 ， 其 中 
(qi, B1…B)Ed(g', b, Al) 
通过 它 ， 在 读 入 aia,…a,b 后 ， 栈 中 将 包含 B,… BA,…A,。 
对 推导 步骤 的 步 数 进行 简单 的 归纳 论证 ， 证 明 如 果 
Sw 
则 
(qi, w, SF (qi, 4, z) 
通过 运用 式 (7-1) 与 式 (7-3) 有 
(go w, zj (qi, w, Sz)F (gq1, A, DF- (qs, A, z) 
使 得 L(G) CL(M)。 
为 了 证 明 LM)C L(G)， 设 wEL(M)， 根 据 定义 可 得 
(qo, w, 2)F (gp 4, u) 
但 是 由 于 从 go 到 gi 以 及 从 gq, 到 gq 都 仅 存在 一 条 路 径 ， 因 而 必然 存在 
(qi, w, Sz)F (qi, A, z) 
现在 通过 设 w = ajasay…a,， 则 
(qi, aiQ2a3°"*a,, SF (gi1, 4, z) (7-4) 
中 的 第 一 步 必然 采用 形 如 式 (7-2) 的 规则 以 得 到 


(qi, aia203 ao SF (qi, a2a3°…*an, UZ) 
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但 另 一 方面 ， 文 法 中 存在 形 如 5 一 aiu; 的 规则 ， 因 而 
9 一 Qit 
如 此 重复 ， 设 u, = Au,， 我 们 将 得 到 
(qi1, G2Q3°"*4n, Aus2) HF (gi, a3°**a,, UaU27) 
它 表明 在 文法 中 存在 4 一 ayu3， 因 而 也 就 可 得 
S$ ala ual 
这 使 得 任 一 时 刻 栈 的 内 容 (z 除 外 ) 与 句 型 中 没有 匹配 的 部 分 是 一 致 的 ， 因 此 根据 式 (7-4) 
可 得 
Saqa%a, 
结果 有 LCM)C L(G)， 如 果 语 言 不 包含 A， 则 证 毕 。 
如 果 XEL， 我 们 可 以 在 待 构造 的 npda 中 加 入 转移 函数 
(go, 人 ， z) = {(qp, z)} 
使 得 空 串 也 能 够 被 接受 。 国 
例 7.6 考虑 文法 
S—aA 
A—aABC|bBla 
B—b 
C—>C 
由 于 该 文法 已 经 是 格 里 巴克 范式 了 ， 所 以 我 们 可 以 直接 应 用 前 面 定 理 中 的 构造 方法 。 除 了 规则 
0(qo, A， z) = {(qi, $2)} 
和 
0(q A, z) = {(qs, 2)} 
pda 还 将 包含 转移 规则 
qi, a, S) = {(qi1, A)} 
691， CQ， 4) 三 {(qi, ABO), (qi, A)} 
od(qi,b, A) = {(gqi, B)} 
dq1, b, B) = {(gqi, A)} 
6(q c, C) = {(gi, 1)} 
通过 使 用 MM 处理 aaabc 的 迁移 序列 为 
(qo, aaabc, z) - (gi, aaabc, Sz) 
~ (qi, aabc, Az) 


FF (qi, abc, ABC?z) 
FF (qi, be, BCz) 
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HF (qi, ¢, C2) 
FF (qi, A, 2z) 
FF (gp 4, z) 
与 之 对 应 的 推导 是 
S—aA~>aaABC—aaaBC=—aaabC—aaabc 器 


为 了 简化 论证 ， 在 定理 7.1 的 证 明 中 假定 了 文法 是 格 里 巴克 范式 ， 但 这 并 不 是 必要 的 。 
对 于 一 般 性 的 上 下 文 无 关 文 法 ， 我 们 同样 可 以 类 似 地 得 到 稍微 复杂 一 点 的 构造 方法 。 例 如 对 
形 如 
4 一 Bx 


的 产生 式 ， 通 过 在 栈 中 使 用 Bx 替 换 4， 但 不 读 入 任何 输入 符号 来 模拟 用 该 产生 式 进行 的 推导 ; 
而 对 于 形 如 
A—abCx 


的 产生 式 ， 应 首先 将 输入 中 的 ab 与 栈 中 的 相似 符号 串 进行 匹配 ， 然 后 用 Cx 赫 换 4。 我 们 将 这 
种 形式 的 构造 方法 以 及 相关 的 证 明 留 做 习题 。 


7.2.2 下 推 自动 机 相应 的 上 下 文 无 关 文法 


定理 7.1 的 逆 命题 也 成 立 。 相 关 的 构造 方法 已 经 说 明了 这 一 点 : 颠倒 定理 7.1 中 的 构造 过 程 ， 
使 用 文法 模拟 pda 中 的 转移 。 这 也 就 是 说 使 句 型 中 的 变量 部 分 反映 栈 的 内 容 ， 而 已 经 处 理 的 输 
入 作为 句 型 的 仅 含 终结 符 前 缀 。 为 了 做 到 这 点 ， 我 们 只 需 稍 做 说 明 。 
为 了 使 讨论 尽 可 能 地 简单 ， 我 们 将 假定 问题 中 的 npda 满 足 如 下 要 求 : 
1. 它 只 有 一 个 终 态 9， 且 当 且 仅 当 栈 为 空 时 才 进 入 终 态 ; 
2. 所 有 转移 函数 的 形式 应 该 是 6(q;, a, 4) = {cl ci,…, cs}， 共 中 
ci= (gH (7-5) 


或 
ci= (gq;, BO) (7-6) 


也 就 是 说 ， 每 一 次 迁移 对 栈 进行 的 修改 都 是 要 么 增加 一 个 符号 ， 要 么 减少 一 个 符号 。 

上 述 限 制 看 起 来 似乎 有 点 严格 ， 但 实际 上 并 不 是 这 样 的 。 可 以 证 明 对 于 任意 的 apda， 都 
存在 一 个 满足 特性 1 与 2 的 等 价 形式 。7.1 节 的 习题 16 与 习题 17 就 已 经 部 分 地 阐述 了 这 种 等 价 形 
式 。 这 里 需要 做 进一步 的 阐述 ， 但 同样 我 们 将 其 留 做 习题 (本 节 习 题 16)。 假 定 这 是 成 立 的 ， 
我 们 将 为 npda 接 受 的 语言 构造 上 下 文 无 关 文法 。 

如 前 所 述 ， 我 们 要 用 名 型 表示 栈 的 内 容 。 但 npda 的 格局 还 包含 一 个 内 部 状态 ， 而 且 这 个 
状态 又 必须 记录 在 句 型 中 。 对 于 这 点 ， 很 难说 明 它 是 怎么 完成 的 ， 下 面 我 们 给 出 的 构造 方法 
将 会 比较 复杂 。 

假设 现在 我 们 可 以 找到 一 个 文法 使 得 其 变量 形 如 (9A49) 而 产生 式 为 

(giAg) 全 
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则 当 且 仅 当 在 读 到 v 并 且 从 状态 gq; 向 gq 转换 上 时，npda 接 除 4。 这 里 的 “ 按 除 ” 指 的 是 将 4 以 
及 4 的 影响 (比如 ， 所 有 替换 它 的 后 继 符号 串 ) 从 栈 中 删除 ， 并 使 得 原来 4 下 面 的 符号 被 置 于 
栈 顶 。 如 果 我 们 能 够 找到 这 样 一 个 文法 ， 并 以 (gqozq/) 作为 它 的 开始 符 ， 则 
(gozghj) 全 wm 


当 且 仅 当 在 读 入 符号 串 w 并 从 go 转换 到 gq/ 时 ，npda 删 除 z 〈 创建 一 个 空 栈 ) 。 这 就 是 npda 接 受 w 
的 过 程 。 因 此 ， 由 文法 生成 的 语言 与 npda 接 受 的 语言 是 相同 的 。 
为 了 构造 一 个 文法 能 够 满足 这 些 条 件 ， 我 们 将 检查 由 npda 执 行 的 不 同类 型 的 转移 函数 。 
由 于 式 (7-5) 包含 对 4 的 立即 擦 除 ， 所 以 文法 中 存在 一 个 对 应 的 产生 式 
(qiAgq) a 
式 (7-6) 类 型 的 产生 式 将 生成 如 下 的 规则 集合 
(giAq) a(qBq}(qiCqn) 
其 中 qi 和 gq/ 可 取 Q 中 所 有 可 能 的 值 。 这 是 由 于 为 了 擦 除 4， 当 读 到 a 并 且 从 g, 到 g 转 换 上 时 ， 我 们 首 
先 需 要 用 BC 替换 4。 接 下 来 状态 从 gj 转换 到 gi 并 按 除 8B， 然后 从 g 转 换 到 gq, 并 按 除 C。 
在 最 后 一 步 中 ， 我 们 似乎 加 入 了 太 多 产生 式 ， 这 是 由 于 在 接 除 8 时 ， 可 能 存在 一 些 无 法 从 
9; 达 到 的 状态 q,。 的 确 如 此 ， 但 是 这 并 不 影响 该 文法 。 因 为 即使 得 到 的 结果 文法 中 变量 (4,Bg,) 
是 无 用 的 ， 也 不 会 影响 文法 接受 的 语言 。 
最 后 ， 我 们 以 ( gozq) 作为 文法 的 开始 变量 ， 其 中 gy 是 npda 的 唯一 终 态 。 
例 7.7 考虑 npda， 它 的 转移 函数 如 下 . 
(go, a, 2z) 三 {(9o， Az)} 
6(go, a, 4) 三 {(go, A)} 
Od(qo, b, A) 三 {(qi, )} 
dq1, A， z) 三 {(q», A)} 
用 go 作为 初 态 ，9 作 为 终 态 ， 该 npda 满 足 前 述 条 件 1 但 并 不 满足 条 件 2。 为 了 满足 后 者 ， 我 们 引 
和 人 了 一 个 新 的 状态 9; 和 一 个 中 间 步 骤 ， 在 该 步骤 中 ， 我 们 首先 从 栈 中 删除 4， 然 后 在 下 一 次 迁 
移 中 替换 它 。 新 的 转换 规则 集合 为 
oao， a, 2z) 三 {(qo, Az)} 
6(q;, 人 ， z) 三 {(go, Az)} 
6(go, a, 4) = {(g;, A)} 
(qo, b, A) = {(qi, A)} 
6(qi, 和 A, z) 三 {(q2, A)} 
后 三 个 转移 函数 符合 式 (7-5) 的 形式 ， 因 而 可 以 直接 得 到 相应 的 产生 式 
(goAg3) >a, (goAg) >b, (qiz92) A 
根据 前 两 个 转移 函数 ， 可 以 得 到 产生 式 集合 


(qozqo) >a(qoAgo)(qozqo)|la(qoAqi)(q1zqo)| 
a(qoAq,)(q2zqo)la(qoAqs)(q3zqo) 
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(qozqi) >a(qoAgo)(qozg i)|a(qoAqi)(q1zq)| 
a(qoAq2)(q2zq91)|a(qoAq3)(q3z91) 

(qozq2)—>a(goAgo)(qozq)la(qoAqi)(qizq2)| 
a(go492)(g2z92?)|a(go493)(g3z9?) 

(qozq3) >a(qoAqo)(qozq3)la(qoAqi)(qizq3)| 
a(qoAq;)(q2z43)|a(qoAqs)(q3cq3) 


(g3z40)—*(qoAqo)(qozqo)|(9oAq1)(q1z9o) (qoAq;)(q2z90)|(qoAq3)(q3q0) 
(432q1) > (qoAqo)(qozqgi)|(qoAq1)(q1z90)1(qohAq)(q2z9) (qo4q3)(g3zq1) 
(g3292) >(qoAqo)(qoz92)|(90Aq1)(qizq2)|(qoAq;)(92z4)|(qoAq3)(q3zq2) 
(q3743)—>(qoAqo)(gozq3)|(qoAqi)(qizq3)|(qoAq;)(92z93)|(qoAq3)(q93793) 


其 中 开始 变量 为 (qozq,)。 符 号 串 aab 通 过 如 下 的 连续 格局 能 够 被 pda 接 受 


(qo, aab, z)}+- (qo, ab, Az) 
(gs, b, z) 
上 (qo, b, Az) 
(qi, A, 2) 
F (gq,, 4, A) 
而 它 在 G 中 相应 的 推导 为 


(q07q2)—>a(qoAq3)(q3zq;) 
一 00(9329)) 
一 44(9o491)(9iz92) 
=>aab(qizq;) 


—aab 


如 果 你 注意 到 了 pda 的 连续 瞬时 描述 与 推导 中 名 型 间 的 对 应 关系 ， 就 更 易于 理解 下 面 定理 的 证 
明 步 县 。 其 中 每 个 名 型 最 左 变量 中 的 第 一 个 4 是 pda 的 当前 状态 ， 而 中 间 的 符号 序列 与 栈 内 容 


相同 。 
虽然 这 一 构造 方法 得 到 的 是 一 个 非常 复杂 的 文法 ， 但 是 它 可 以 应 用 于 任何 pda， 只 要 该 
pda 的 转移 规则 满足 给 定 条 件 。 同 时 ， 这 也 为 一 般 性 结论 的 证 明 提 供 了 基础 。 口 


定理 7.2 对 于 任何 一 个 npda M， 如 果 L 二 L(M)， 则 上 L 是 上 下 文 无 关 语 言 。 
证 明 : 假定 M = (2, ,TT, 6, qo, z, {qj}) 满足 前 述 条 件 1 与 条 件 2， 我 们 使 用 上 面 的 构造 方法 得 到 
文法 G = (V,T, 5, P)， 其 中 T=，V 由 形 如 (gicg)) 的 元 素 组 成 。 我 们 将 证 明 这 样 得 到 的 文法 
满足 如 下 条 件 9 对 于 所 有 的 g;， geQ, AET, XET ， u, VE ， 根据 

(qi, uv, AXPF (gj, Vv, X) (7-7) 
可 得 
(q:Aq) =>u 

反之 亦 然 。 

第 一 部 分 证 明 的 是 ，npda 任 何 时 候 都 满足 在 读 到 x 并 从 状态 9 到 4 转换 时 ， 都 能 将 符号 4 及 
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其 影响 从 栈 中 删除 ， 则 变量 (qi49j) 就 能 导出 &。 显 而 易 见 ， 文 法 的 构造 就 是 用 于 完成 这 一 工作 


的 。 我 们 只 需 对 迁移 的 步 数 做 归纳 就 能 清楚 地 说 明 这 一 点 。 
针对 逆 命 题 ， 考 虑 推导 中 单独 的 一 步 ， 比 如 
(gq:Aq)—a(qgBq)(giCqn) 
对 npda 使 用 相应 的 转移 函数 
6(q;, a, A) = {(9 BC), …} (7-8) 
我 们 可 以 看 到 在 控制 部 件 读 入 a 并 从 状态 qi; 迁移 到 gq 时， 可 以 从 栈 中 删除 4， 压 入 8C。 类 似 地 ， 
如 果 
(qi:Aq)=>a (7-9) 
则 必定 存在 相应 的 转移 函数 
(qi, a, A) = {(g,, A)} (7-10) 
通过 它 ， 可 以 从 栈 中 弹出 4。 从 这 可 以 看 出 ， 由 4,49j 导 出 的 句 型 定义 了 npda 的 一 个 可 能 的 格局 
序列 ， 通 过 它 也 就 可 以 得 到 式 (7-7)。 
注意 某 些 q)8g,，gqiCq: 不 存在 式 (7-8) 或 式 (7-10) 形式 的 转移 函数 ， 但 可 能 存在 (949gj) 一 
a(qjBqn)(qiCqe)。 但 在 这 种 情况 中 ， 至 少 有 一 个 右 部 的 变量 是 没 用 的 。 而 由 于 所 有 的 句 型 都 将 有 
一 个 终结 符 串 ， 因 此 命题 成 立 。 
如 果 我 们 现在 将 结论 应 用 到 
(go, w, zF (ge, 人 ， A) 
将 看 到 上 式 成 立 当 且 仅 当 
(9ozgj >w 


因而 LM) = CO)。 国 
习题 


1. 证 明 例 7.5 中 构造 的 pda 能 够 接受 由 给 定 文法 生成 的 语言 中 的 符号 串 aaaBDBD。 
2. 证 明 例 7.5 中 的 pda 能 接受 语言 L = {a”!!'b” :7>0}。 
3. 构造 一 个 npda 能 够 接受 由 如 下 文法 生成 的 语言 : 


SaSbblaab 向 
4. 构造 一 个 npda 能 够 接受 由 文法 5->a5SSlab 生 成 的 语言 。 渤 
5. 构造 文法 
S—aABBlaAA 
A—aBBla 
->bBBI4 


相应 的 npda。 
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6. 构造 一 个 npda 能 够 接受 由 文法 G = ({5, 4}, {a, 5b}, 5S, P) 生成 的 语言 ， 其 中 产生 式 为 Ss 一 Ahla， 
A—SAlb。 

7. 证明 根 据 定理 7.1 与 定理 7.2 可 以 得 到 : 对 于 任意 npda M ， 都 存在 一 个 至 多 包含 三 个 状态 的 
npda 1 满足 LOM) = LCM)。 者 

8. 说 明 怎样 才能 将 上 面 习 题 中 好 的 三 个 状态 简化 成 两 个 。 

9. 给 出 一 个 只 有 两 个 状态 的 npda 接 受 语言 L = {a"b"+!':n>0}。 者 

10. 给 出 一 个 只 有 两 个 状态 的 npda 接 受 语言 上 = {a"b” : n> 1}。 

11. 证 明 例 7.7 中 的 npda 能 够 接受 语言 Caarb)。 激 

12. 证 明 例 7.7 中 的 文法 能 够 生成 语言 L(aaxb)。 

13. 证 明 例 7.7 中 的 变量 (qoBqo) 与 (qozq1) 是 无 用 的 。 

14. 根据 定理 7.1 中 的 构造 方法 ， 构 造 npda 能 够 接受 7.1 节 中 例 7.5 的 语言 。 

15. 给 出 一 个 上 下 文 无 关 文 法 ， 能 够 生成 由 npda M = ea 41}, {a, 5b}, {4,z}, 6, qo, z, {41)) 接 受 
的 语言 。 它 的 转移 函数 如 下 


(qo, a, z) 三 {(gqo, Az)} 
6(qo, b, A) 三 {(do， A4)} 
qo, a, A) 三 {(qi, A)} 


16. 说 明 对 于 任意 npda， 都 存在 一 个 等 价 的 形式 满足 定理 7.2 导 引 中 的 条 件 1 和 条 件 2。 
17. 给 出 定理 7.2 的 完整 证 明 。 
18. 给 出 一 个 构造 方法 ， 使 得 任意 上 下 文 无 关 文 法 都 能 用 于 定理 7.1 的 证 明 。 


7.3 确定 型 下 推 自 动机 和 确定 型 上 下 文 无 关 语言 


确定 型 下 推 接受 器 (deterministic pushdown accepter, dpda) 是 没有 迁移 选择 的 下 推 自动 
机 。 它 可 以 通过 修改 定义 7.1 得 到 。 

定义 7.3 ”一 个 下 推 自动 机 有 = (CQ, Z,T, 6, go z, FF) 称 为 确定 型 的 ， 如 果 它 是 根据 定义 7.1 
定义 的 自动 机 并 且 满 足 如 下 的 限制 条 件 : 对 于 任 塌 gqEQ, aEFU{A}， 以 及 bET， 有 

1. 6(q, a,b) 最 多 包含 一 个 元 来; 

2. 如 果 6(g, A,b) 非 室 ， 则 对 于 每 个 cEF ，6(g,c,b) 都 必须 为 空 。 | 

第 一 个 条 件 要 求 对 于 任意 给 定 的 输入 符号 与 栈 顶 符号 ， 最 多 只 能 执行 一 种 迁移 。 第 二 个 
条 件 说 明 ， 如 果 对 某 一 格局 看 在 人 迁移 ， 则 不 能 有 读 入 输入 符号 的 迁移 。 

我 们 来 看 一 下 这 个 定义 与 确定 型 有 穷 自 动机 定义 的 区 别 。 转 移 函 数 仍 采用 定义 7.1 中 的 定 
义 域 而 不 是 C x xT， 这 是 因为 我 们 想 保留 转移。 由 于 栈 顶 符号 在 决定 下 一 次 迁移 中 发 挥 作 
用 ， 因 而 4 转移 的 存在 并 不 必然 导致 非 确定 型 。 同 时 ，dpda 的 一 些 转移 函数 也 允许 为 空 集 ， 也 
就 是 说 它们 没有 定义 ， 因 而 可 能 存在 死 格 局 。 但 这 并 不 对 确定 型 的 定义 造成 影响 ， 因 为 对 确 
定型 的 唯一 标准 是 : 任何 时 候 都 至 多 存在 一 种 可 能 的 迁移 。 

定义 7.4 ”语言 [是 确定 型 上 下 文 无 关 语言 (deterministic context-free language) 当 且 仅 当 
存在 一 个 dpda M 满 足 L=L(M)。 

例 7.8 语言 
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L= {a'b":n>0} 
是 确定 型 上 下 文 无 关 语 言 。 由 于 pda M 三 ({qo, di, q2}, {a, b}, {0, 1}, 6, do， 0， {qo}) 能 够 接受 语 
言 [， 其 中 M 的 产生 式 为 

dqo, a, 0) = {(q1, 10)} 

qi, a, 1) = {(q1, 11)} 

(qi, b, 1) 三 {(g;, A)} 

(gq,, b, 1) 三 {(g;, A)} 

6gq,, 4, 0) = {(qo, A)} 


并 且 M 满 足 定义 7.4 中 的 条 件 ， 所 以 L 是 确定 型 的 。 口 
例 7.4 中 的 npda 不 是 确定 型 的 ， 因 为 


(qo, a, a) 三 {(qo, aa)} 


和 
6(gqo, 人 ， a) 三 {(9，， a)} 
与 定义 7.3 中 的 条 件 2 冲 突 。 当 然 ， 这 并 不 表明 语言 {ww 信 本 身 一 定 是 非 确定 型 的 ， 因 为 可 能 存 
在 一 个 等 价 的 dpda。 但 事实 上 ， 该 语言 确实 是 非 确定 型 的 。 从 这 个 例子 和 下 一 个 要 举 的 例子 
中 ， 我 们 将 看 到 ， 与 有 穷 自 动机 不 同 的 是 确定 型 下 推 自动 机 与 非 确 定型 下 推 自动 机 不 是 等 价 
的 。 因 为 存在 非 确定 型 上 下 文 无 关 语 言 。 
例 7.9 设 
Li= {a’b” :n>20} 


和 
[= {a'b” :n>0} 


其 中 心 是 一 个 上 下 文 无 关 语言 ， 通 过 对 其 证 明 做 一 些 明显 的 修改 ， 可 证 明 疡 也 是 上 下 文 无 关 语 
言 。 语 言 L = LiUL, 同 样 是 上 下 文 无 关 的 。 这 个 结论 可 以 从 下 一 章 中 的 一 个 一 般 性 定理 得 到 ， 
但 现在 只 能 简单 地 说 明 它 似乎 是 合理 的 。 设 C = (Vi, T, $1, Pi) 和 G, = (Vs,T, $2, Py) 是 上 下 文 
无 关 文 法 ， 满足 世 = L(G,) 和 L, = L(G,) ， 如 果 我 们 假定 Vi 与 V, 是 不 相交 的 ， 并 且 SEViUV,， 
则 合并 它们 可 得 文法 G = (VI,UV2U{5}, T, $, P)， 其 中 

P= PIUP,U{S—5|S,} 


生成 语言 L,UL,。 讲 到 这 里 证 明 思路 已 经 相当 清楚 了 ， 但 我 们 在 第 8 章 中 才 会 给 出 论证 的 详细 
内 容 ， 由 上 述 ， 可 得 L 是 上 下 文 无 美的。 但是，L 不 是 确定 型 上 下 文 无 关 语 言 ， 这 看 起 来 是 合 
理 的 ， 因 为 pda 必 须根 据 每 个 4 匹配 一 个 或 者 两 个 bp， 所 以 不 论 输入 的 是 L 还 是 L,， 它 都 需要 做 
出 一 个 初始 选择 ， 而 在 符号 串 的 开始 部 分 没有 足够 的 信息 可 以 用 于 确定 型 地 做 出 哪 一 种 选择 。 
当然 ， 这 种 推理 基于 我 们 了 解 的 某 个 特定 算法 ; 它 有 可 能 让 我 们 得 到 正确 的 推测 ， 但 并 不 能 
证 明 任 何事 情 。 而 且 总 是 有 可 能 存在 一 种 完全 不 同 的 方法 可 以 避免 初始 选择 ， 但 上 述 语言 能 
确 不 存在 这 样 的 方法 ， 因 而 是 非 确定 型 的 。 为 了 说 明 这 一 问题 ， 我 们 首先 假定 : ZL 是 一 个 确 
定型 上 下 文 无 关 语言 ， 则 
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£ = LUtf{a'b'c’ :n>0} 


也 是 上 下 文 无 关 的 。 我 们 将 通过 在 给 定 Z 的 dpda M 的 情况 下 ， 构 造 的 npda MM 来 进行 说 明 。 

构造 的 方法 是 : 在 M 的 控制 部 件 中 增加 一 个 类 似 的 部 件 , 把 由 2 引起 转移 改 为 由 c 引 起 转移 。 
在 M 读 入 a"b" 后 ， 新 部 件 将 在 控制 部 件 中 发 挥 作用 。 由 于 第 二 个 部 件 对 c" 的 响应 与 第 一 个 部 件 
对 bp" 的 响应 是 相同 的 ， 所 以 处 理 a"b”* 的 过 程 同样 也 能 够 接受 a*b"c"。 图 7-2 生 动 地 描述 了 这 一 构 
造 。 下 面 给 出 形式 化 的 证 明 。 


增加 部 件 


M 的 控制 部 件 





设 M = (Q,,T 了 , 6, qo,z,F)， 其 中 
Q = {go, qi1, **…, qn} 
然后 考虑 及 = (0,Z,T,5U6,z, 问 ， 其 中 
@-CU 信 ,人 2) 
关 -FU 们 :4 EF 
并 通过 如 下 方式 在 6 中 加 入 转移 函数 构造 4。 首 先 对 所 有 /EF, sEF， 在 8 中 加 入 


6(q 4,s) ={(0,,5)} 
然后 对 所 有 

(qi, b, s) = {(g), )} 
其 中 ，q/EQ, sET, wuET"*, 在 86 中 加 入 

6(G,,c,5) ={(9,,)} 
因为 M 能 够 接受 ab"， 所 以 我 们 一 定 能 得 到 

(qo, a"b”, Fn (gi, A, u) 


其 中 qg/EF。 由 于 M 是 确定 型 的 ， 所 以 
(go, a"b™, zw (gi, b", u) 
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也 必然 成 立 ， 使 得 MM 能 够 接受 a%b”"， 这 样 ， 我 们 就 能 进一步 地 得 到 
(gi, b", WF (gj, 人 ， Ui) 


其 中 gEF。 然 后 通过 构造 
(Qi, c", WF gp (@,, A, ui) 


使 得 MM 能 够 接受 a"b"c"。 除 此 之 外 ， 仍 需要 说 明 说 不 能 接受 非 和 中 的 符号 串 ; 这 将 在 本 节 
的 几 个 习题 中 阐述 。 据 此 可 得 结论 L- LM) ， 因 而 是 上 下 文 无 关 的 。 但 是 在 下 一 章 ( 例 
8.1) 中 我 们 将 得 到 工 不 是 上 下 文 无 关 的 。 因 此 ， 对 上 是 确定 型 上 下 文 无 关 语 言 的 这 一 假设 
是 错误 的 。 口 


习题 


1. 证 明 L = {a"b”: n>0} 是 确定 型 上 下 文 无 关 语 言 。 
2. 证 明 L = {a"b”: m>n +2} 是 确定 型 的 。 
3. 语言 L = {a*b" ; n> 1}U{b} 是 否 是 确定 型 的 ? 
4. 例 7.2 中 的 语言 L = {a : n> 1}Uf{a} 是 否 是 确定 型 的 ? 大 
5. 证 明 例 7.3 中 的 下 推 自动 机 不 是 确定 型 的 ， 但 该 例 中 的 语言 是 确定 型 的 。 
6. 针对 习题 ! 中 的 语言 上 ， 说 明 忆 是 确定 型 上 下 文 无 关 语 言 。 
7. 给 定语 言 
L= {arb"ct :n= m 或 m= 襄 


为 什么 能 推测 出 它 是 非 确 定型 的 ， 试 给 出 理由 。 

8. 语言 L = {Qa"b”" :n= m 或 n = m +2} 是 否 是 确定 型 的 ? 

9. 语言 L = {wcw” : wE{a,b}'} 是 否 是 确定 型 的 ? 竹 

10. 如 果 习 题 9 中 的 语言 是 确定 型 的 ， 而 与 之 密切 相关 的 语言 L = {ww : wE{a, b}》} 却 是 非 确定 
型 的 ， 针 对 这 一 问题 ， 给 出 合理 的 解释 。 

11. 证 明 语言 L = {wE{a, pb : ns(w) 三 nn6(w)} 是 确定 型 上 下 文 无 关 语言 。 参 

12. 证 明 例 7.9 中 的 家 不 能 接受 a"b"c+， 其 中 kn。 

. 证 明 例 7.9 中 的 必 不 能 接受 L(a*b'e') 以 外 的 符号 串 。 

14. 证 明 例 7.9 中 的 必 不 能 接受 a"b”c* (其 中 x>0)。 证 明 只 有 当 m = n 或 m = 2n 并 有 Lk = 0 时 ， 它 
才能 接受 a"b"c*。 

15. 证明 所 有 的 正则 语言 都 是 确定 型 上 下 文 无 关 语 言 。 允 

16. 如 果 L 是 确定 型 上 下 文 无 闫 语言， 而 ZL 是 正则 语言 ， 则 LUL 是 确定 型 上 下 文 无 关 语 
言 。 克 

17. 如 果 工 ,是 确定 型 上 下 文 无 关 语 言 ， 而 L 是 正则 语言 ， 则 LNL 是 确定 型 上 下 文 无 关 语 言 。 

18. 给 出 一 个 确定 型 上 下 文 无 关 语言 的 实例 ， 而 其 转 置 不 是 确定 型 的 。 


7.4 确定 型 上 下 文 无 关 语言 的 文法 * 


由 于 确定 型 上 下 文 无 关 语言 能 够 被 有 效 地 分 析 ， 因 而 它 在 实际 应 用 中 显得 特别 重要 。 在 
直观 上 ， 我 们 可 以 将 下 推 自动 机 看 成 一 个 语法 分 析 设 备 。 由 于 不 存在 回 湖 ， 因 而 很 容易 写 出 


bs 
ww 
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与 它 相应 的 计算 机 程序 ， 并 期 望 它 能 有 效 地 工作 。 但 由 于 4 转移 的 存在 ， 我 们 不 能 立刻 得 出 结 
论 : 它 是 一 个 线性 时 间 的 语法 分 析 器 。 但 无 论 如 何 ， 它 已 经 把 我 们 引入 了 正确 的 途径 。 为 了 
实现 这 一 目标 ， 我 们 将 关注 什么 形式 的 文法 适用 于 描述 确定 型 上 下 文 无 关 语 言 。 这 里 我 们 将 
进入 编译 器 研究 的 一 个 重要 主题 ， 但 这 不 是 我 们 的 兴趣 所 在 。 因 此 本 节 只 简单 介绍 了 其 中 的 
一 些 重要 结论 ， 更 多 的 内 容 可 参见 与 编译 器 相关 的 书籍 。 

假定 我 们 自 顶 向 下 地 进行 语法 分 析 ， 并 试图 为 特定 的 句子 找到 其 最 左 推导 。 为 了 便于 讨 
论 ， 将 采用 图 7-3 中 阅 述 的 方法 。 我 们 从 左 至 右 地 扫描 输入 符号 串 w， 当 到 达 某 一 名 型 时 ， 它 
的 终结 符 前 缀 将 与 截止 到 当前 所 扫描 符号 的 w 前 组 匹配。 为 了 能 够 继续 匹配 后 续 符 号 ， 我 们 需 
要 确切 地 知道 在 每 一 步 中 应 当 用 哪 一 条 产生 式 规则 ， 这 将 避免 回溯 从 而 得 到 高 效 的 语法 分 析 
器 。 现 在 的 问题 在 于 是 否 存 在 这 样 的 文法 允许 我 们 这 么 做 。 对 于 一 般 性 的 上 下 文 无 关 文 法 ， 
这 可 能 并 不 成 立 ， 但 如 果 上 下 文 无 关 文法 的 形式 是 受 限 的 ， 我 们 就 能 够 达到 这 一 目标 。 
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图 7-3 


首先 ， 考 虑 定义 5.4 中 介绍 的 简单 文法 。 根 据 其 讨论 ， 我 们 可 以 很 清楚 地 看 到 在 分 析 的 每 
一 步骤 中 ， 它 都 能 够 准确 地 知道 使 用 了 哪 一 个 产生 式 。 假 定 w = wiw; 并 且 已 经 到 达 了 各 型 
wiAx， 为 了 得 到 与 w 中 下 一 个 符号 匹配 的 句 型 中 的 下 一 个 符号 ， 我 们 只 需要 看 w, 的 最 左 符号 ， 
比如 说 a。 如 果 在 文法 中 不 存在 形 如 A->ay 的 规则 ， 则 符号 串 w 不 属于 该 语言 ， 如 果 存 在 这 样 
的 规则 ， 则 分 析 过 程 可 以 继续 。 在 这 里 ， 它 只 存在 一 个 这 样 的 规则 ， 所 以 没有 其 他 的 选择 。 

尽管 简单 文法 是 有 用 的 ， 但 它 太 严格 了 ， 以 至 于 不 能 描述 出 程序 设计 语言 的 所 有 语法 现 
象 。 我 们 需要 将 这 个 思想 一 般 化 ， 使 得 它 更 为 强大 而 又 不 失语 法 分 析 的 基本 性 能 。ZZ 文 法 
(LL grammar) 即 是 这 样 的 一 种 文法 。 在 LL 文法 中 ， 我 们 仍然 保持 在 输入 中 看 有 限 个 字符 
(由 扫描 的 符号 加 上 跟 在 它 后 面 的 有 限 个 符号 组 成 )，、 即 可 准确 预测 使 用 哪 一 个 产生 式 的 特性 。 
在 有 关 编 译 器 的 书 中 ， 术 语 LL 是 标准 用 法 ; 第 一 个 L 表 明 输 入 采用 的 是 从 左 至 右 的 扫描 方式 ， 
第 二 个 L 表 明 采 用 的 是 最 左 推导 。 每 个 简单 文法 都 是 LL 文法 ， 但 是 LL 文法 更 具 一 般 性 。 

例 7.10 文法 

S—aSblab 


不 是 简单 文法 ,但 它 是 LL 文法 。 为 了 确定 使 用 哪个 产生 式 ， 我 们 只 需 看 输入 符号 串 中 两 个 连 
续 的 符号 。 如 果 第 一 个 是 a 第 二 个 是 b， 我 们 就 必须 使 用 产生 式 5->ab， 否 则 就 必须 采用 规则 
S—aSb。 口 ] 
一 个 文法 ， 如 果 给 定 当前 输入 的 符号 以 及 “向 前 看 ”上 - 1 个 符号 ， 我 们 就 能 够 唯一 地 确 
定 使 用 哪 一 个 产生 式 ， 则 该 文法 是 ZL( 文法 。 例 7.10 中 的 文法 是 LL(2) 文法 。 
例 7.11 文法 
S->SSlaSpblap 


[200] 
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生成 例 7.10 中 语言 的 正 闭 包 ， 正 如 例 5.4 中 所 说 的 那样 ， 这 是 一 个 描述 正确 岂 套 括号 结构 的 语 
言 。 该 文法 对 任意 都 不 是 LL(A) 文法 。 

为 了 说 明 这 一 原因 ， 让 我 们 来 看 长 度 大 于 2 符号 串 的 推导 。 一 开始 ， 我 们 有 两 个 可 能 的 产 
生 式 5 一 SS 和 5->aSb 作 为 选择 ， 但 是 根据 当前 扫描 到 的 符号 并 不 能 确定 使 用 哪个 产生 式 。 假 定 
我 们 采用 向 前 看 的 方式 ， 并 且 考 虑 前 两 个 符号 ， 如 果 它 们 是 ae， 是 否 就 能 据 此 做 出 正确 的 决 
定 呢 ? 答案 仍 是 否定 的 ， 因 为 它 可 以 是 该 语言 中 多 个 符号 串 的 的 前 绥 ， 比 如 acbpp，aabpab。 
在 第 一 种 情况 下 ， 我 们 应 该 必须 选择 S$->aSb， 而 第 二 种 情况 则 必须 使 用 5 一 $5。 因 此 该 文法 不 
是 LL (2) 文法 。 采 用 同样 的 方式 ， 我 们 可 以 看 到 无 论 向 前 看 多 少 个 符号 ， 总 是 存在 一 些 无 法 
解决 的 情况 。 

上 述 情形 中 的 文法 并 不 能 说 明 该 语言 就 是 非 确 定型 的 或 者 不 存在 产生 该 语言 的 LL 文法 。 
如 果 我 们 能 分 析出 原文 法 不 满足 LL 文法 的 原因 ， 就 可 以 为 该 语 言 构 造 一 个 LL 文法 。 该 问题 的 
难度 在 于 直到 符号 串 的 末尾 ， 我 们 才能 够 知道 到 底 存在 多 少 个 重复 的 基本 模式 ozg"， 然 而 文法 
需要 立刻 对 此 做 出 决定 。 我 们 可 以 通过 重 写 文法 来 解决 这 一 问题 ， 文 法 

S—aSbS|A 


是 一 个 LL 文法 ， 它 与 原文 法 几 平 是 等 价 的 。 
为 了 说 明 这 一 点 ， 考 虑 mw = apap 的 最 左 推导 ， 可 得 
S=—aSbS=—abS=>abaSb$S—abab$S—abab 


从 中 可 以 看 到 我 们 没有 任何 其 他 的 选择 ,如果 输入 的 符号 是 a, 我 们 就 必须 使 用 产生 式 S-aSbS， 
如 果 输 入 的 符号 是 bp， 或 者 这 时 已 经 达到 符号 申 的 末尾 ， 就 必须 使 用 5 一 和 4。 
到 现在 为 止 ， 问 题 还 没有 完全 解决 ， 因 为 新 的 文法 能 够 产生 空 串 。 我 们 通过 引入 一 个 新 
的 开始 变量 5o 以 人 确保 仅 产 生 非 空 符号 捉 的 产生 式 来 解决 这 一 问题 。 这 样 将 得 到 最 终结 果 
So—aSbs 
S—>aSbSIA 


它 是 LL 文法 并且 与 原文 法 是 完全 等 价 的 。 口 
虽然 上 面 对 LL 文 法 的 非 形式 化 描述 对 于 理解 简单 的 例子 已 经 足够 了 ， 但 是 为 了 得 到 严格 
的 结论 ， 我 们 需要 一 个 更 准确 的 LL 文法 定义 。 我 们 以 下 面 的 定义 来 结束 讨论 。 
定义 7.5 设 G=(V,T,5,P) 是 一 个 上 下 文 无 关 文法 ， 如 果 对 每 个 最 左 推导 对 
Ss wiAx wiyX wiw, 


* 来 
SWwAx, wiyyX Ww 


其 中 wi, w,, waE7， w2 和 ws 最 左 的 Kk 个 符号 的 等 同性 意味 着 y, = y,， 则 称 G 为 LL(K) 文法 。 (如 果 
|w:| 或 es| 的 长 度 小 于 K， 则 取 它 们 的 最 小 长 度 代替 大。 ) 

通过 定义 ， 我 们 可 以 清楚 地 看 到 ， 在 最 左 推导 (mwihxz) 的 任意 阶段 ， 如 果 我 们 能 逮 知 道 
输入 的 下 k 个 字符 ， 则 推导 的 下 一 步 是 唯一 确定 的 (如同 yj = yy 所 表示 的 )， 

LL 文法 是 编译 器 学 习 的 一 个 重点 ， 很 多 程序 设计 语言 都 可 以 采用 LL 文法 定义 ， 很 多 编译 
器 也 是 采用 LL 分 析 器 写 的 ， 但 是 LL 文法 还 不 够 一 般 化 ， 不 能 处 理 所 有 的 确定 型 上 下 文 无 关 语 
言 ， 因 此 要 关注 其 他 更 具 一 般 性 的 确定 型 文法 。 LR 文法 就 是 其 中 特别 重要 的 一 种 ， 它 同样 支 
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持 有 效 的 语法 分 析 ， 但 采用 的 是 自 底 向 上 的 推导 树 构 造 方式 ， 在 关于 编译 器 〈 例 如 ，Hunter 
1981) 或 者 形式 语言 语法 分 析 方 法 〈 例 如 Aho 和 Ullman 1972) 的 书籍 中 存在 大 量 关 于 这 一 主 


题 的 资料 。 


习题 


© 


. 证 明 例 7.11 中 的 第 二 个 文法 是 LL 文法 并 且 它 与 原始 文法 是 等 价 的 。 


证 明 例 1.13 中 的 产生 语言 L = {w : no(w) = 6(w)} 的 文法 不 是 LL 文法 。 才 
为 习题 2 中 的 语言 构造 一 个 LL 文法 。 

为 语言 L(a*ba)UL(abbb") 构造 相应 的 LL 文法 。 洁 

证 明 任意 的 LL 文法 都 是 无 二 义 性 的 。 

证 明 如 果 G 是 LL(k) 文法 ， 则 L(G) 是 确定 型 上 下 文 无 关 语言 。 

证 明 一 个 确定 型 上 下 文 无 关 语 言 不 是 固有 二 义 性 的 。 澡 


. 设 G 是 一 个 上 下 文 无 关 文 法 ， 且 符合 格 里 巴克 范式 。 设 计 一 个 算法 ， 对 于 任意 给 定 的 :， 它 


都 能 够 确定 文法 G 是 不 是 LL(h) 文法 。 


.给 出 下 列 语言 的 LL 文法 ， 其 中 > = {a, b,c}。 


(a L= {ab"c"+" .n>20,m>20} 吉 
(b) L= {a't?b"c"t™". n>0,m>0} 
(cL= {ab"tc":n>20,m>1} 
(DL= {w: nw) <n(w))} 

(© L={w: nw) + nw) tn(w)} 





第 8 章 ”上 下 又 无 关 语 言 的 性 质 


上 下 文 无 关 语言 族 在 形式 语言 体系 中 占有 首要 的 位 置 。 一 方面 ， 上 下 文 无 关 语言 本 身 包 
括 了 一 些 重要 的 受 限 语言 族 ， 比 如 正则 语言 与 确定 型 上 下 文 无 关 语 言 。 另 一 方面 ， 上 下 文 无 
关 语 言 又 是 更 大 的 语言 族 的 一 个 特例 。 为 了 理 清 不 同 语言 族 之 间 的 关系 以 及 展现 它们 的 相似 
性 与 区 别 ， 我 们 将 研究 不 同 语言 族 的 特性 。 像 第 4 章 一 样 ， 我 们 要 考察 语言 在 各 种 运算 下 的 封 
闭 性 、 用 于 确定 语言 族 中 成 员 性 质 的 算法 以 及 诸如 泵 引 理 这 样 的 结构 性 结论 。 所 有 这 些 为 我 
们 理解 不 同 语言 族 之 间 的 关系 提供 了 途径 ， 同 时 它们 也 有 助 于 我 们 将 某 一 特定 语言 归 人 合适 
的 族 中 。 


8.1 两 个 泵 引 理 

定理 4.8 给 出 的 泵 引 理 为 证 明 某 些 语言 不 是 正则 语言 提供 了 一 种 有 效 手段 。 对 其 他 语言 族 
也 存在 着 类 似 的 泵 引 理 。 这 里 我 们 将 讨论 两 个 这 样 的 结论 ， 一 个 是 针对 一 般 性 的 上 下 文 无 关 
语言 的 ， 另 一 个 是 针对 一 种 受 限 形式 的 上 下 文 无 关 语 言 的 。 
8.1.1 上 下 文 无 关 语 育 的 泵 引 理 


定理 8.1 设 L 是 一 个 无 穷 上 下 文 无 闫 语言， 则 存在 一 个 正 整 数 m 使 得 对 于 任意 满足 |w|>m 
的 wEL 都 能 够 被 分 解 为 


Ww = UVxyz (8-1) 
其 中 
vxy| < m (8-2) 
且 
lvy|> 1 (8-3) 
则 对 于 所 有 的 i = 0, 1, 2,…， 满 足 
uvixy'zEL (8-4) 


这 就 是 上 下 文 无关 语 言 的 泵 引 理 。 
证 明 : 考虑 语言 L - {4}， 设 生成 它 的 文法 为 G， 并 且 G 没 有 单位 产生 式 与 4 产生 式 。 由 于 产生 
式 右 部 符号 串 长 度 总 是 有 界 的 ， 比 如 设 界 为 E， 则 任意 wEZ 的 推导 长 度 至 少 为 lw|r。 而 由 于 
是 无 穷 的， 所 以 它 存在 任意 长 的 推导 以 及 对 应 的 任意 高 度 的 推导 树 。 

现在 来 看 一 个 具备 这 样 高 度 的 推导 树 以 及 某 个 从 根 到 叶 的 足够 长 的 路 径 。 由 于 G 中 的 变量 
是 有 限 的 ， 因 而 必然 会 在 该 路 径 中 存在 重复 出 现 的 变量 ， 如 图 8-1 所 示 。 与 图 8-1 中 推导 树 对 应 
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S uAhz SuvAyz Suvxyz 


其 中 u,v, x, y 以 及 z 都 是 终结 符 串 。 从 上 可 得 4 污 vAy 和 A 洁 x， 因 而 所 有 的 符号 串 uvxyz, i = 0， 

2, …, 都 能 够 根据 文法 生成 ， 因 此 它们 也 属于 此 外 ， 可 以 假定 推导 A 宇 v4y 和 4 之 x 中 没有 
重复 变量 (如果 有 的 话 ， 我 们 就 以 它 作 为 4)， 因 此 符号 串 v, x 与 > 的 长 度 仅 与 文法 中 的 产生 式 
有 关 ， 且 它们 受到 w 长 度 的 限制 ， 因 而 式 (8-2) 成 立 。 最 后 由 于 不 存在 单位 产生 式 与 4 产生 式 ， 
所 以 * 与 ?不 能 同时 为 空 ， 则 可 得 式 (8-3)。 





x 


图 8-1 长 符号 串 的 推导 树 


这 样 我 们 就 证 明了 式 (8-1) 至 式 (8-4) 都 成 立国 

该 泵 引 理 在 证 明 一 个 语言 不 属于 上 下 文 无 关 语 言 族 方 面 非常 有 用 。 一 般 而 言 ， 这 也 是 泵 
引 理 的 典型 应 用 ; 它们 用 于 确定 一 个 给 定语 言 不 属于 某 一 族 。 如 定理 4.8 所 说 ， 正 确 的 证 明 过 
程 可 以 看 成 是 一 个 与 智能 对 手 的 游戏 ， 只 是 现在 的 规则 变 得 更 难 了 一 些 。 对 于 正则 语言 ， 长 
度 不 超过 m 的 子 串 xy 是 从 w 的 左 端 开 始 的 ， 因 此 能 够 抽取 的 子 串 y 也 就 在 从 w 左 端 开始 的 m 个 符 
号 中 。 而 对 于 上 下 文 无 关 语 言 ， 我 们 仅 限制 lvxyl 的 上 界 。vxy 之 前 的 子 串 可 以 是 任意 长 度 的 ， 
这 也 就 给 予 了 对 手 更 多 的 自由 ， 同 时 也 使 得 与 定理 8.1 相 关 的 证 明 更 加 复杂 。 

例 8.1 证 明 语言 

L= {ab'c":n20} 


不 是 上 下 文 无 关 的 。 

一 旦 对 手 选 定 m， 我 们 就 挑选 L 中 的 符号 串 a"b"c"。 现 在 对 手 存 在 儿 种 可 能 的 选择 。 如 果 
他 选 定 的 vxy 中 只 包含 a， 则 抽取 得 到 的 符号 申 显 然 不 在 L 中 ; 如 果 它 选 定 的 vxy 包 含 相同 数目 
的 a 与 5»， 则 抽取 得 到 的 符号 申 为 etpre"， 其 中 zm， 同样 它 也 不 在 L 中 。 事 实 上 ， 对 手 唯一 可 
以 阻止 我 们 成 功 的 办 法 就 是 选取 wy， 使 得 y 有 同样 多 的 a b 以 及 c。 但 根据 式 (8-2) 的 限制 ， 
这 是 不 可 能 的 。 因 此 ，Z 不 是 上 下 文 无 关 的 。 

但 如 果 对 语言 Z = {a"b"} 采 用 同样 的 证 明 方 法 ， 它 将 不 起 作用 ， 因为 L 是 上 下 文 无 关 的 。 
如 果 我 们 选取 中 诸如 w = "zx" 的 任意 符号 串 ， 对 手 就 可 以 选取 ” = a 与 y = b+。 那 么 ， 不 管 我 
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们 选取 什么 样 的 ?， 抽 取得 到 的 结果 符号 串 w 总 是 属于 上 的 。 要 记 住 ， 虽 然 如 此 ， 但 是 这 并 不 能 
证 明 L 就 是 上 下 文 无 关 的 ， 对 此 我 们 只 能 说 ， 这 里 我 们 通过 泵 引 理 不 能 得 到 任何 结论 。 而 要 证 
明 L 是 上 下 文 无 关 语言 ， 需 要 采用 其 他 的 证 明 方法 ， 比 如 构造 产生 L 的 上 下 文 无 关 文 法 。 

上 述 证 明 验 证 了 例 7.9 中 给 出 的 命题 ， 并 使 我 们 对 那个 例子 的 理解 能 够 连贯 起 来 。 语 言 


L={a'b"}U{ab™”} Ut{a"b'e")} 


不 是 上 下 文 无 关 的 。 这 是 因为 符号 串 a"b"e" 在 中 ， 但 其 抽取 的 结果 不 在 六 中 。 口 
例 8.2 考虑 语言 
L= {ww :WE{a, pb 


虽然 上 述 语言 与 例 3.1 中 的 上 下 文 无 关 语言 十 分 类 似 ， 但 它 不 是 上 下 文 无 关 语言 。 
考虑 符号 串 
arb"a"b" 
现在 对 手 存在 多 种 选取 vxy 的 方式 ， 但 是 对 于 他 的 每 一 个 选择 ， 我 们 都 有 获胜 的 对 抗 方 法 。 比 
如 ， 采 用 图 8-2 中 的 选择 ， 我 们 就 可 以 使 用 ;= 0 来 得 到 符号 串 
atpia"b",k<m 或 j<m 
它 不 在 L 中 。 对 于 对 手 的 其 他 选择 ， 我 们 可 以 用 类 似 的 论证 方法 获胜 。 因 此 可 得 : L 不 是 上 下 
文 无 关 语 言 。 口 L208 
例 8.3 证 明 L = {a" :n>0} 不 是 上 下 文 无 关 语 言 。 
在 例 4.11 中 , 我 们 已 经 证 明了 该 语言 不 是 正则 的 。 然而, 对 于 字母 表 只 有 一 个 符号 的 语言 ， 
在 定理 8.1 与 正则 语言 的 泵 引 理 之 间 几 乎 是 不 存在 区 别 的 。 无 论 何 种 情况 ， 由 于 抽取 的 符号 串 
都 是 由 a 组 成 的 ， 因 而 能 够 通过 定理 8.1 得 到 的 符号 电 ， 通 过 定理 4.8 同 样 也 可 以 得 到 。 因此 ， 
我 们 可 以 使 用 例 4.11 中 的 方法 来 证 明 L 不 是 上 下 文 无 关 语 言 。 口 
例 8.4 证 明 L = {a"b’ :n= 有 不 是 上 下 文 无 关 语言 。 
根据 定理 8.1， 给 定 m， 我 们 可 以 选取 a™b" 作 为 待考 察 的 符号 申 。 现在 对 手 有 几 种 可 能 的 
选择 ， 而 只 有 图 8-3 中 给 出 的 选择 需要 更 多 思考 。 抽 取 i 次 将 得 到 的 新 符号 申 有 m? + (i 一 1)k 个 a 
与 m+ (i 一 1D) 个 bp。 如 果 对 手 选取 汪 0，kz 沽 0， 我们 就 可 令 i=0。 由 于 
(m-— kb) < (m-1) 


=m -2m+1 
<m’—k, 
因此 结果 不 属于 L。 而 如 果 对 手 选取 k=0，k*0 或 者 kh +0，k 二 0， 那 么 同样 可 令 i=0， 抽 取 
得 到 的 符号 串 也 不 在 L 中 。 至 此 可 得 L 不 是 上 下 文 无 关 语 言 。 口 
- 殉 , 到 殉 , 兄 、 一 和 一 一 外 一 
CN 一 一 
ap 
UVAy Z 7 x y Zz 


8-2 图 8-3 
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8.1.2 线性 语言 的 泵 引 理 


我 们 在 前 面 对 线 性 上 下 文 无 关 文 法 与 非 线 性 上 下 文 无 关 文 法 做 了 区 分 ， 这 里 我 们 将 对 相 
应 的 语言 做 类 似 的 区 分 。 

定义 8.1 对 一 个 上 下 文 无 关 语 言 ， 如 果 硝 在 线性 上 下 文 无 关 文 法 G 满 足 L=L(G)， 则 该 语 
言 被 称 为 线性 语言 。 

显然 ， 每 一 个 线性 语言 都 是 上 下 文 无 关 语言 ， 但 是 我 们 还 没有 给 出 它 的 逆 命 是 是否 成 立 


的 结论 。 
例 8.5 ”语言 L = {a"b" : 4> 0} 是 线性 语言 ， 例 1.10 给 出 了 它 的 线性 文法 。 而 例 1.12 中 给 定 
的 语言 L = {w : m(w) = mw(w)} 的 文法 不 是 线性 的 ， 因 此 语言 L 不 一 定 是 线性 的 。 口 


当然 ， 仅 仅 根 据 一 个 特定 的 文法 是 非 线性 的 ， 不 能 说 明 由 该 文法 生成 的 语言 都 是 非 线性 
的 。 如 果 我 们 需要 证 明 一 个 语言 是 非 线性 的 ， 就 必须 证 明 不 存在 等 价 的 线性 文法 。 为 了 达到 
这 一 目的 ， 我 们 采用 常规 方法 ， 通 过 建立 线性 文法 的 结构 特性 ， 然 后 再 证 明 某 些 上 下 文 无 关 
语言 没有 这 样 的 特性 。 . 

定理 8.2 设 L 是 一 个 无 穷 线 性 语言 ， 存 在 某 个 正 整 数 m， 使 得 任意 wEL (其 中 |w|>m) 都 
能 够 被 分 解 为 w 二 uvxyz， 其 中 


luvyz| < m (8-5) 
lxy| > 1 (8-6) 

则 对 于 所 有 的 i = 0, 1,2,… 满 足 
uvixyizEL (8-7) 


注意 ， 上 述 定理 得 到 的 结论 与 定理 8.1 是 存在 区 别 的 ， 这 是 由 于 使 用 式 (8-5) 替换 了 式 

(8-2)。 这 表明 可 以 抽取 的 符号 串 * 与 ?必须 分 别 位 于 w 中 自 左 端 开始 的 长 度 为 m 的 符号 串 中 和 w 
中 自 右 端 开始 的 长 度 为 m 的 符号 种 中 。 而 中 间 符 号 串 x 可 以 为 任意 长 度 。 
证 明 : 我 们 的 推理 过 程 遵循 定理 8.1 的 证 明 。 由 于 语言 是 线性 的 ， 因 而 对 它 存在 某 个 线性 文法 。 
为 了 使 用 定理 8.1 中 的 证 明 ， 我 们 还 必须 保证 文法 G 中 没有 单位 产生 式 与 4 产生 式 。 通 过 考察 定 
理 6.3 与 定理 6.4 的 证 明 可 以 看 出 ， 消 除 单位 产生 式 与 4 产生 式 将 不 会 破坏 文法 的 线性 特性 ， 因 
此 我 们 可 以 假定 文法 G 满 足 相应 的 要 求 。 

现在 考虑 图 8-1 中 的 推导 树 。 由 于 文法 是 线性 的 ， 所 以 变量 只 能 出 现在 从 $ 到 第 一 个 4 的 路 
径 中 、 从 第 一 个 4 到 第 二 个 4 的 路 径 中 ， 以 及 从 第 二 个 4 到 树 的 某 个 叶 结 点 的 路 径 中 。 因 为 从 8 
到 第 一 个 4 的 路 径 中 只 有 有 穷 个 变量 ， 且 它们 都 只 能 产生 有 穷 数 目的 终结 符 ， 所 以 x 与 z 的 长 度 
一 定 是 有 穷 的 。 同 理 ，* 与 ?也 是 有 穷 的 ， 可 知 式 (8-5) 成 立 。 

剩 下 的 证 明 过 程 与 定理 8.1 相 同 。 国 

例 8.6 语言 上 = {w : now) = nm(w)} 不 是 线性 的 。 

为 了 证 明 上 述 命题 ， 假 定 此 语言 是 线性 的 并 且 对 符号 串 


w = a"b”a” 


应 用 定理 8.2。 根 据 不 等 式 (8-5) 可 知 ， 在 这 种 情况 下 ， 符 号 串 , vy, y, z 都 必须 只 包含 4。 这 样 





上 下文 无 尖 请 辣 扒 性 乓 145 


抽取 该 符号 串 将 得 到 a”"**p™a"*'， 其 中 > 1 或 1> 1， 而 它 不 在 L 中 ， 这 与 定理 8.2 矛 盾 ， 也 就 证 
明 该 文法 不 是 线性 的 。 口 

上 例 回答 了 上 下 文 无 关 语 言 族 与 线性 语言 族 之 间 关系 的 一 般 性 问题 。 线 性 语言 族 是 上 下 
文 无 关 语 言 族 的 真子 集 。 


习题 


.采用 与 例 4.11 中 类 似 的 推理 过 程 给 出 完整 证 明 : 例 8.3 中 的 语言 不 是 上 下 文 无 关 的 。 
证 明 语 言 L = {a : n 是 质数 } 不 是 上 下 文 无 关 语 言 。 
证 明 语言 L = {ww*w : wEf{a,b}"} 不 是 上 下 文 无 关 语言 。 者 
证 明 语 言 L = {wE{a, b,c} :na(w) + np(w) = n2(w)} 不 是 上 下 文 无 关 语 言 。 
了 上 = {a"b”" :n= 2"} 是 否 是 上 下 文 无 关 语言 ? 
证 明 语言 2 = {a”: n>0} 不 是 上 下 文 无 关 语 言 。 
.证 明 下 列 定义 2 = {a, b,c} 上 的 语言 不 是 上 下 文 无 关 的 。 

(DL= {ab:n<)}D 

(bD)L={ab :n>20— 1)} 

(oO) L= {abict :k= jn} 

(dL= {abct:k>n,k>)) 

(eo) L={abct:n<j,n<ke)) 

(DL={w:n(w)<nw) <n(w)}S) 

(DL={w: nwn(w) = nw)} 

(h) L= {wE{a ,bc :ns(w) = n,(w) = 2n(w)} 
. 判断 下 述 语言 是 否 为 上 下 文 无 关 的 。 

(WL= {awwra’ :n>20,wEt{a, b}'} 

(b) 工 = {arbiarb’ :n>0,j>0} 稳 

(CO) L= {a"biab" :n>20,j;>0} 

(dD) L= {abatb'i:.n+tj<k+l} 

(e) L= {aba'b': mg 大 JS 人 

(DL = {anpoe :mg 及 
9. 在 定理 8.1 中 ， 根 据 文法 6G 的 性 质 给 出 m 的 范围 。 
10. 判断 语言 


mb 


oo 


L= {wicw; : wi, WE{fa,p wii 产 mW)} 


是 否 是 上 下 文 无 关 的 。 乔 
11. 证 明 语言 L = {a"b"a"b”" : n> 0,m>0} 是 上 下 文 无 关 的 ,但 不 是 线性 的 。 
12. 证 明 语言 = {w : ns(w) > n,(w)} 不 是 线性 的 。 叫 
13. 证 明 语言 L = {wEf{a, b,c}* : ns(w) + np(w) = ne(w)} 是 上 下 文 无 关 的 ， 但 不 是 线性 的 。 
14. 判断 语言 L = {a"b’ ; j<n< 2j 一 1) 是否 是 线性 的 。 
15. 判断 例 5.12 中 的 语言 是 否 是 线性 的 。 葡 
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16. 在 定理 8.2 中 ， 根 据 文法 G 的 性 质 给 出 m 的 范围 。 

17. 证 明定 理 8.2 中 的 命题 ， 对 于 任意 的 线性 语言 (不 包含 A)， 都 存在 一 个 不 包含 单位 产生 式 
与 人 产生 式 的 线性 文法 。 

18. 考虑 所 有 形 如 a/b 的 符号 串 集合 ， 其 中 a 与 5 都 是 十 进 制 正 整 数 且 a <b， 该 集合 表示 了 所 有 
正 的 十 进 制 的 小 数 。 判 断 该 集合 代表 的 语言 是 否 是 上 下 文 无 关 的 。 

友 19. 证 明 习 题 6 中 语言 的 补 不 是 上 下 文 无 关 的 。 

20. 判断 如 下 语言 是 否 是 上 下 文 无 关 的 ? 

L= {am : 1 与 m 是 质数 } 大 


8.2 上 下 文 无 关 语 言 的 封闭 性 质 和 判定 算法 

在 第 4 章 中 ， 我 们 学 习 了 某 些 运算 的 封闭 性 以 及 用 于 判定 正则 语言 族 性 质 的 算法 。 总 的 来 
说 ， 在 那里 提出 的 问题 易于 回答 。 但 要 针对 上 下 文 无 关 语言 回答 同样 问题 ， 相 对 来 说 要 更 加 
困难 。 首先， 正则 语言 中 成 立 的 封闭 性 在 上 下 文 无 关 语 言 中 并 不 一 定 成 立 。 即 使 成 立 ， 这 些 
命题 的 证 明 也 常常 是 非常 复杂 的 。 其 次 ， 在 上 下 文 无 关 语言 中 ， 一 些 直观 上 简单 而 又 重要 的 
问题 目前 无 法 解决 。 乍 看 起 来 令 人 难以 置信 ， 对 此 我 们 将 在 后 续 的 学 习 中 予以 详细 阑 述 。 本 
节 只 是 给 出 了 一 些 重要 结论 的 样 例 。 


8.2.1 上 下 文 无 关 语言 的 封闭 性 质 
定理 8.3 上 下 文 无 关 语 言 族 对 并 运算 、 连 接 运算 和 闭 包 运 算是 封闭 的 。 
证 明 : 设 L, 和 LL, 是 两 个 上 下 文 无 关 语 言 ，G1 和 G, 分 别 是 生成 L1 与 ;的 上 下 文 无 关 文 法 。 
其 中 Gi = (Vi, TD, $1, P), G, = (V,, LT,, $,, P,). 不 失 一 般 性 地 ， 我 们 可 以 假定 集合 WW 与 刀 是 不 
相交 的 。 
考虑 语言 L(G3)， 生 成 它 的 文法 为 
Cs = (VUVU{S}, TIUTD,, $3, P;) 
其 中 5; 是 不 属于 ViUV, 的 变量 。G; 中 的 产生 式 包 括 G1 的 产生 式 、G, 的 产生 式 以 及 一 个 用 于 决定 
使 用 文法 C, 还 是 G: 的 选择 性 开始 产生 式 。 更 为 准确 地 摘 述 为 
Ps = PIUP:U{S: 一 SS)} 
显然 ，G 是 一 个 上 下 文 无 关 文法 ， 因 而 L(G;) 是 一 个 上 下 文 无 关 语言 。 同 时 容易 看 出 
L(G3) = LiUL, (8-8) 
3 一 9 >w 
是 文法 G; 的 一 个 可 能 推导 。 对 于 wEL, 可 以 得 到 同样 的 结论 。 而 如 果 wEL(G,)， 则 推导 的 第 一 
步 一 定 是 
S3=>5] . (8-9) 
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或 
5 一 9 (8-10) 
如 果 使 用 式 (8-9)， 由 于 自 $, 导 出 的 句 型 只 包含 V! 中 的 变量 ， 且 Vi 与 V, 是 不 相交 的 ， 所 以 推导 
Siow 


只 与 P! 中 的 产生 式 相关 ， 因 此 w 也 就 必然 属于 L,。 另 一 种 情况 ， 如 果 首 先 使 用 式 (8-10)， 则 w 
必然 在 L, 中 。 由 此 可 得 L(G3) 是 与 ,的 并 。 
接 下 来 ， 考 虑 
CO = (VIUVU{S}, TiUTD,, $4, Pa) 
这 里 5s 是 一 个 新 的 变量 ,并且 
P,= PIUPU{S 一 99 
则 容易 得 到 
L(G) = LG)L(G,) 
最 后 ， 考 虑 L(G;)， 生 成 它 的 文法 为 
Gs = (VIU{Ss}, T, Ss, Ps) 
其 中 5; 是 一 个 新 的 变量 ， 且 
Ps = PIU{Ss—>S1S,|A} 
则 可 得 
L(Gs) = L(Gi) 
这 样 ， 我 们 就 已 经 证 明了 上 下 文 无 关 语言 族 对 并 运算 、 连 接 运 算 和 闭 包 运算 是 封闭 的 。 国 
定理 8.4 上 下 文 无 关 语言 族 对 交 运 算 和 补 运算 是 不 封闭 的 。 
证 明 : 考虑 语言 
Li= {a'b'c”:n20,m>0} 
与 
L,= {ab"c™:n20,m>0} 
存在 几 种 方式 可 以 证 明 L 与 ,都 是 上 下 文 无 关 的 。 例如 ， 生 成 L, 的 文法 为 
S$—>51S, 


Si >aSiblA 
S,—cS,| 和 A 


另外 ， 注 意 到 已 是 两 个 上 下 文 无 关 语言 的 连接 ， 根 据 定理 8.3， 可 知 它 是 上 下 文 无 关 的 。 但 我 
们 已 经 证 明 
LNL, = {anbrcn :n> 0} 


ktD 
ECE- 
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I 引 不 是 上 下 文 无 关 的 。 因 此 上 下 文 无 关 语 言 族 对 交 运 算是 不 封闭 的 。 


[ed 
人 


定理 的 第 二 部 分 可 以 根据 定理 8.3 以 及 集合 恒等式 
LNL=LUL 

进行 证 明 。 如 果 上 下 文 无 关 语言 类 对 补 运算 是 封闭 的 ， 则 对 于 任意 的 上 下 文 无 关 语 言 L1 与 5， 
上 述 恒 等 式 右边 的 语言 是 上 下 文 无 关 语言 。 但 是 这 与 我 们 刚刚 证 明 的 结论 相 了 矛盾 ， 也 就 是 两 
个 上 下 文 无 关 语言 的 交 运 算 不 一 定 是 上 下 文 无 关 的 。 因 而 可 以 得 到 ， 上 下 文 无 关 语言 对 补 运 
算是 不 封闭 的 。 卢 

虽然 两 个 上 下 文 无 关 语言 的 交 运算 生成 的 语言 可 能 不 是 上 下 文 无 闫 的 ， 但 如 果 其 中 一 个 
语言 是 正则 的 ， 交 运算 的 封闭 性 就 成 立 。 

定理 8.5 设 L 是 一 个 上 下 文 无 关 语 言 ， 已 是 一 个 正则 语言 ， 则 LL 门 是 一 个 上 下 文 无 关 语 言 。 
证 阴 : 设 M, = (Q, ,TT, 61, qo,z, 下) 是 接受 语言 L 的 一 个 npda，M, = (P, ,6,, po, F) 是 接受 语 
言 /的 dfa。 我 们 构造 一 个 下 推 自动 机 让 = (6,2,T,6,9。,z, 让 ， 它 能 够 模拟 M1 与 M, 的 并 行动 作 : 
当 读 人 输入 符号 捉 的 一 个 符号 时 ， 说 同步 地 执行 MI 与 M, 的 迁移 。 最 后 设 


并 定义 6 使 得 
(ge p1), *) Eb((qg;, pi),a,b) 


当 且 仅 当 (gi， IEO(q a, b) 与 6,(p,, a) = pi。 

在 这 里 我 们 同样 要 求 如 果 a = 入 ， 则 pj = p,。 换 旬 话 说， 应 的 状态 由 状态 对 (gq, p;) 标记 ， 它 
们 分 别 表示 M1 与 M, 在 读 入 某 一 个 输入 符号 串 后 能 够 到 达 的 状态 。 通过 一 个 简单 的 归纳 证 明 可 
以 得 到 : 


((qo, po), Ww, PF 所 ((g,, Pp», Xx) 


其 中 g,EF1 且 p,EF,， 当 且 仅 当 (qo, w, zy (gq,,x) 和 6'(po,w) = p, 成 立 。 
因此 ， 如 果 一 个 符号 串 可 以 被 碑 接 受 ， 当 且 仅 当 它 能 够 被 M1 与 M, 接 受 ， 也 就 是 说 ， 它 属于 
L(MDNL(M)) = LNL,。 故 

本 定理 给 出 的 性 质 被 称 为 正则 交 运 算 (regular intersection) 的 封闭 性 。 根 据 该 定理 的 结 
论 ， 我 们 可 以 得 到 ， 上 下 文 无 关 语 言 族 对 正则 交 运 算是 封闭 的 。 在 简化 针对 特定 语言 的 相关 
证 明 中 ， 这 一 封闭 性 有 时 是 有 用 的 。 

例 8.7 证 明 语言 L = {a"b" : n>0,nx100} 是 上 下 文 无 关 的 。 

针对 这 一 命题 ， 可 以 采用 构造 该 语言 的 pda 或 者 上 下 文 无 关 文 法 的 方式 证 明 ， 但 证 明 过 程 
是 繁琐 的 。 根 据 定 理 8.5， 我 们 可 以 得 到 一 个 更 加 简 尘 的 证 明 。 

设 

二 {alo0plo0} 
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由 于 L 是 有 穷 的 ， 因 而 它 是 正则 的 。 同 样 ， 容 易 看 出 
L= {a'b' :n>O0}NEL, 

因此 ， 根 据 正 则 语言 补 运算 的 封闭 性 以 及 上 下 文 无 关 语 言 的 正则 交 运 算 的 封闭 性 ， 可 以 得 到 
需要 的 结论 。 口 

例 8.8 证 明 语言 

了 = {wE{a, b,c} :ns(w) = ns(w) = nA(w)} 

不 是 上 下 文 无 关 的 。 

可 以 采用 泵 引 理 来 证 明 这 一 命题 。 但 是 根据 正则 交 运 算 的 封闭 性 ， 我 们 可 以 得 到 一 个 更 
加 简洁 的 证 明 。 假 设 L 是 上 下 文 无 关 的 ， 则 

LNL(a'b'c)= {a'b'c’ :n>0} 

也 将 是 上 下 文 无 关 的 ， 但 我 们 已 知 它 不 是 上 下 文 无 关 的 。 因 此 可 得 L 不 是 上 下 文 无 关 的 。 口 

语言 的 封闭 性 质 在 形式 语言 理论 中 发 挥 着 重要 的 作用 ， 针 对 上 下 文 无 关 语言 ， 可 以 建立 
更 多 的 封闭 性 质 。 本 节 习 题 中 将 介绍 另外 一 些 相 关 的 结论 。 : 


8.2.2 上 下 文 无 关 语言 的 可 判定 性 质 


结合 定理 5.2 与 定理 6.6， 我 们 已 经 确立 了 上 下 文 无 关 语言 的 成 员 资格 判定 算法 。 这 对 任何 
语言 族 都 是 一 个 在 实际 中 很 有 用 的 基本 特性 。 上 下 文 无 关 语言 的 其 他 一 些 简单 性 质 也 是 可 以 
确定 的 。 根 据 讨 论 的 需要 ， 我 们 假定 语言 都 由 相应 的 文法 描述 。 

定理 8.6 给 定 一 个 上 下 文 无 关 文法 G = (V,T, 5S, P)， 存 在 判定 L(G) 是 否 为 空 的 算法 。 
证 明 : 为 了 简化 ， 假 设 妊 L(G)。 如 果 不 是 这 样 的 ， 证 明 过 程 只 需要 做 一 些小 的 改动 。 我 们 将 
对 其 应 用 消除 无 用 符号 与 无 用 产生 式 的 算法 。 如 果 5 是 无 用 的 ， 则 L(G) 为 空 ， 否 则 L(G) 至 少 
包含 一 个 元 素 。 国 

定理 8.7 给 定 一 个 上 下 文 无 关 文 法 G = (V, T, 5, P)， 存 在 判定 L(G) 是 否 有 穷 的 算法 。 
证 明 : 假设 G 中 没有 4 产生 式 、 单 位 产生 式 以 及 无 用 符号 。 如 果 该 文法 中 有 一 个 重复 的 变量 ， 
也 就 是 说 存在 某 一 个 4EV， 它 有 推导 


A SxAy 
由 于 G 中 没有 单位 产生 式 与 4 产生 式 ， 因 此 x 与 y 不 能 同时 为 空 。 又 因为 4 既 不 是 可 空 变量 也 不 
是 无 用 符号 ， 所 以 可 得 

SuAv Sw 

和 

A>z 
其 中 u,v 与 z 都 属于 7T*"。 则 对 所 有 的 n 

SuAv urAy'y ux'zy'y 
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都 是 可 能 的 ， 所 以 L(G) 是 无 穷 的 。 

如 果 文 法 中 没有 重复 的 变量 ， 则 任意 推导 的 长 度 都 不 会 超过 | 中， 在 这 种 情况 下 ，ZL(G) 显 
然 是 有 穷 的 。 

因此 ， 为 了 得 到 判定 L(G) 是 否 有 穷 的 算法 ， 我 们 仅 需要 判定 文法 中 是 否 存在 重复 的 变量 。 
我 们 可 以 通过 变量 依赖 图 来 完成 ， 在 该 方法 中 ， 如 果 存 在 产生 式 


A-—>xBy 


则 存在 相应 的 边 (4, 8)。 在 得 到 的 依赖 图 中 ， 回 路 中 的 任意 一 个 开始 符号 都 是 可 重复 的 。 
而 ， 一 个 文法 中 存在 重复 变量 当 且 仅 当 依赖 图 中 存在 回路 。 
我 们 有 了 判定 文法 中 是 否 存 在 重复 变量 的 算法 ， 就 有 判定 一 个 语言 LO) 是 否 有 穷 的 算法 。 重 
令 人 奇 堡 的 是 ， 上 下 文 无 关 语 言 中 的 其 他 简单 性 质 却 不 这 么 容易 处 理 。 如 定理 4.7， 我 们 
希望 能 够 找到 判定 两 个 上 下 文 无 关 文 法 生成 的 语言 是 否 相同 的 算法 ， 但 事实 证 明 不 存在 这 样 
的 算法 。 就 目前 而 言 ， 虽 然 这 在 直观 上 很 明确 ， 但 我 们 还 没有 相应 的 技术 机 制 能 够 准确 地 给 
出 “没有 算法 ”的 准确 含义 。 这 是 一 个 重点 ， 后 面 我 们 还 会 回来 讨论 它 。 


习题 


习题 8.8 中 语言 的 补 是 否 是 上 下 文 无 关 的 ? 各 

考虑 定理 8.4 中 的 语言 L,， 证 明 该 语言 是 线性 的 。 

证 明 上 下 文 无 关 语 言 族 在 同 态 下 具有 封闭 性 。 

证 明 线 性 语言 族 在 同 态 下 是 封闭 的 。 

证 明 上 下 文 无 关 语言 族 在 逆 下 是 封闭 的 。 乔 

指出 自前 讨论 的 语言 族 中 ， 哪 些 在 逆 下 是 封闭 的 。 

证 明 上 下 文 无 关 语 言 族 对 一 般 性 的 差 运 算 不 封闭 ， 但 对 正则 差 运 算 封闭 。 也 就 是 说 ， 如 果 

是 上 下 文 无 关 语 言 ，L 是 正则 语言 ， 则 Li -是 上 下 文 无 关 语 言 。 

: 证 明确 定型 上 下 文 无 关 语 言 族 在 正则 差 运 算 下 是 封闭 的 。 

9. 证 明 线性 语言 族 对 并 运算 是 封闭 的 ， 而 对 连接 运算 不 封闭 。 霹 

10. 证 明 线 性 语言 对 交 运 算是 不 封闭 的 。 

11. 证 明确 定型 上 下 文 无 关 语 言 族 对 并 运算 和 交 运 算是 不 封闭 的 。 

12. 给 出 一 个 上 下 文 无 关 文 法 的 实例 ， 使 得 它 的 补 不 是 上 下 文 无 关 语言 。 

友 13. 证 明 如 果 L 是 线性 语言 ，L, 是 正则 语言 ， 则 ZL 是 线性 语言 。 种 

14. 证 明 无 二 义 上 下 文 无 关 语 言 族 对 并 运算 不 封闭 。 

15. 证 明 无 二 义 上 下 文 无 关 语 言 族 对 交 运 算 不 封闭。 波 

16. 设 L 是 一 个 确定 型 上 下 文 无 关 语 言 ， 根 据 它 定义 一 个 新 的 语言 L = {w : awEL, aEZ}， 判 定 
已 是 否 一 定 是 确定 型 上 下 文 无 关 语 言 。 

17. 证明 语言 2 = {a"b" : n> 0 且 n 不 是 5 的 倍数 } 是 上 下 文 无 关 的 。 

18. 证 明 下 述 语言 是 上 下 文 无 关 的 : 

L= {wE{a,b} :no(w) = ns(w), w 不 包含 子 申 aab} 


19. 确定 型 上 下 文 无 关 语言 族 在 同 态 下 是 否 是 封闭 的 。 


oo 





20. 
.给 出 一 个 算法 、 对 于 任意 给 定 的 上 下 文 无 关 文法 G， 它 都 能 够 判定 是 否 有 XEL(G)。 者 
:证明 存在 一 个 算法 ， 它 能 够 判定 某 一 上 下 文 无 关 文法 生成 的 语言 是 否 包 含 长 度 小 于 某 一 给 


2 
2 


2 
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给 出 定理 8.5 的 详细 推理 论证 。 


定数 "的 字 。 


. 设 志 是 一 个 上 下 文 无 关 语 言 ，Z 是 一 个 正则 语言 ， 证 明 存在 一 个 算法 ， 它 能 够 判定 六 与 忆 


是 否 包含 某 一 相同 元 素 。 





第 9 章 图 灵 机 


在 前 述 的 讨论 中 ， 我 们 磁 到 了 一 些 基本 概念 ， 特 别 是 正则 语言 与 上 下 文 无 关 语 言及 其 与 
有 穷 自动 机 与 下 推 接 受 器 的 关联 。 我 们 的 研究 发 现 ， 正 则 语言 是 上 下 文 无 关 语 言 的 一 个 真子 
集 ， 因 而 下 推 自动 机 也 就 比 有 穷 自 动机 能 力 更 强大 。 同 时 也 已 经 看 到 ， 虽 然 上 下 文 无 关 语 言 
对 于 程序 设计 语言 的 研究 是 重要 的 ， 但 它 在 应 用 范围 上 受到 限制 。 这 一 点 在 上 一 章 中 已 经 说 
得 很 清楚 ， 比 如 - - 些 简单 的 语言 {ab"c"} 与 {ww} 就 不 是 上 下 文 无 关 的 。 这 促使 我 们 考察 、 研 究 
在 上 下 文 无 关 语言 之 外 ， 如 何 定 义 一 个 新 的 语言 族 使 之 能 包含 这 些 例 子 。 因 此 ， 我 们 需要 问 
到 自动 机 的 一 般 性 描述 上 来 。 如 果 我 们 比较 有 穷 自动 机 与 下 推 自动 机 ， 就 可 以 发 现 它们 之 间 
的 区 别 在 于 临时 存储 空间 。 如 果 没 有 存储 ， 得 到 的 就 是 有 穷 自 动机 ; 而 如 果 存 储 机 制 为 栈 ， 
将 得 到 更 强大 的 下 推 自动 机 。 根 据 这 一 观察 推测 ， 如 果 我 们 给 自动 机 更 加 灵活 的 存储 机 制 ， 
将 可 能 发 现 更 加 强大 的 语言 族 。 例 如 ， 在 图 1-3 所 示 的 一 般 性 方案 中 ， 如 果 采 用 两 个 栈 、 三 个 
栈 、 队 列 ， 或 者 其 他 的 一 些 存 储 机 制 ， 将 会 发 生 什么 情况 ?是 否 每 一 种 存储 机 制 都 定义 了 一 
种 新 的 自动 机 ， 并 且 能 够 通过 它 得 到 个 新 的 语言 族 ? 这 种 方式 引发 了 大 量 的 问题 ， 而 它们 
中 的 大 多 数 是 没有 意义 的 。 如 果 能 提出 一 个 更 具 挑 战 性 的 问题 以 及 考虑 能 将 自动 机 的 概念 扒 
向 多 远 ， 将 更 具 指 导 意 义 。 对 于 自动 机 的 最 强 能 力 以 及 计算 的 极限 ， 我 们 可 以 得 到 一 些 什么 
样 的 结论 ? 这 就 黄 定 了 图 灵机 (Turing machine) 概念 的 基础 ， 由 此 也 可 以 得 出 机 械 计算 或 算 
法 的 准确 定义 。 

首先 我 们 将 研究 图 灵机 的 形式 化 定义 ， 然 后 通过 一 些 简单 的 程序 ， 对 图 灵机 的 作用 提供 
一 个 感性 的 认识 。 接 下 来 ， 将 说 明 图 灵机 机 制 是 非常 基本 的 ， 它 的 概念 宽泛 足以 解决 非常 复 
杂 的 过 程 。 图 灵 论 题 的 讨论 结果 表明 ， 图 灵机 可 以 实现 任何 计算 过 程 ， 比 如 目前 计算 机 中 执 
行 的 程序 ， 都 能 在 图 灵机 中 完成 。 


9.1 标准 图 灵机 


虽然 我 们 可 以 想像 出 各 种 具有 复杂 存储 机 制 的 自动 机 ， 但 图 灵机 的 存储 是 非常 简单 的 。 
可 以 将 其 看 成 一 个 一 维 单元 组 ， 其 中 每 一 个 单元 可 以 包含 一 个 符号 。 该 单元 组 可 以 在 两 端 无 
限 扩展 ， 因 此 它 能 够 存储 无 穷 的 信息 。 这 些 信 息 可 以 以 任意 顺序 读 取 和 修改 ， 我 们 称 这 样 的 
存储 机 制 为 带 《〈tape)， 因 为 它 与 实际 计算 机 中 的 磁带 十 分 类 似 。 


9.1.1 图 灵机 的 定义 


图 灵机 是 一 种 自动 机 ， 它 采用 带 作为 临时 存储 。 带 可 以 被 划分 为 若干 单元 ， 其 中 每 一 个 
单元 包含 一 个 符号 。 与 带 关联 的 是 读 写 头 (read-write head)， 它 能 够 在 带 上 左右 移动 ， 并 且 
每 次 移动 能 够 读 写 一 个 符号 。 与 第 1 章 中 描述 的 一 般 方 案 存在 细微 的 区 别 ， 在 这 里 作为 图 灵机 
的 自动 机 既 没 有 输入 文件 也 没有 特别 的 输出 机 制 。 无 论 输入 还 是 输出 都 将 在 自动 机 的 带 上 进 
行 。 后 面 我 们 将 看 到 对 1.2 节 中 的 一 般 模型 做 这 种 修改 不 会 有 什么 影响 。 我 们 也 可 以 保留 其 输 


[ed 





754 落 9 全 











人 文件 与 输出 机 制 而 不 会 影响 后 续 的 结论 ， 但 我 们 没有 这 么 做 ， 因 为 以 这 种 方式 得 到 的 自动 


机 更 易于 描述 。 
图 9-1 给 出 了 图 灵机 的 -- 个 直观 描述 ， 在 定义 9.1 中 ， 我 们 给 出 它 的 准确 定义 。 
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图 9-1 








定义 9.1 图 灵机 1M 由 
M= (0Q,7,T, 6, go,L],F) 
定义 ， 其 中 
Q 是 内 部 状态 的 集合 ， 
5 是 输入 字母 表 ， 
I 是 符号 的 有 穷 集 合 ， 我 们 称 之 为 带 字 母 表 (tape alphabet)， 
0 是 转移 函数 ， 
中 ET 是 一 个 特殊 的 符号 ， 我们 称 之 为 空白 符 (blank )， 
4oEQ 是 初 态 ， 
CO 是 终 态 集 合 。 
在 图 灵机 的 定义 中 ， 我 们 假定 CT ~ { 口 }， 也 就 是 说 输入 字母 表 是 带 字 母 表 的 子 集 ， 但 
它 不 包括 空白 符 。 空 白 久 不 作为 输入 的 原因 将 在 下 面 的 讨论 中 揭示 。 转 移 函 数 6 定义 如 下 
6:0xT—>0xTx{L,R} 


- 般 而 言 ，6 是 C x 工 上 的 部 分 函数 ; 它们 给 出 了 图 灵机 操作 的 规则 。6 的 参数 是 控制 部 件 的 当 
前 状态 以 及 即将 读 和 的 带 符号 。 它 返回 的 结果 是 一 个 新 的 控制 部 件 状态 、 一 个 替换 旧 带 符号 
的 新 符号 以 及 一 个 迁移 符号 L 或 者 R。 迁 移 符号 用 于 表明 在 新 的 带 符号 被 记录 在 带 上 后 ， 读 写 
头 的 移动 方向 : 向 左 或 者 向 右 。 

例 9.1 图 9-2 显 示 了 转移 函数 





[ed 
La 
Ww 


6(gqo, a, 三 (qi, d, R) 


执行 之 前 与 之 后 的 情况 。 

我 们 可 以 将 图 灵机 看 成 一 个 简单 的 计算 机 。 它 有 一 个 存储 有 限 的 处 理 部 件 ， 而 带 上 的 
二 级 存储 容 基 是 无 限 的 。 这 种 计算 机 所 能 处 理 的 指令 是 有 限 的 : 识别 带 上 的 符号 并 根据 它 
确定 下 一 步 的 动作 。 图 灵机 能 够 完成 的 动作 就 是 窗 盖 当前 符号 ， 改 变 控 制 部 件 的 状态 并 移 
动 读 写 头 。 这 么 小 的 指令 集 看 起 来 不 足以 处 理 复杂 的 事情 ,但 实际 情况 并 不 是 这 样 的 。 通 
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常 ， 图 灵机 是 非常 强大 的 。 而 转移 函数 6 定义 了 计算 机 是 怎样 工作 的 ， 也 就 是 我 们 通常 所 说 
的 “程序 ”。 


内 部 状态 gq， 





a) 迁移 前 的 情形 b) 迁移 后 的 情形 
图 9-2 


通常 ， 自 动机 以 一 个 给 定 的 初 态 和 带 上 的 一 些 信息 开始 。 然 后 在 转移 函数 6 的 控制 下 完成 
一 系列 的 动作 。 在 这 -过 程 中 ， 带 上 任何 一 个 单元 的 内 容 可 能 会 被 多 次 检查 与 修改 。 最 后 通 
过 将 图 灵机 置 于 停机 状态 (halt state) 使 整个 过 程 结束 。 当 图 灵机 到 达 一 个 6 中 没有 定义 的 格 
局 时 ， 将 会 停机 ; 这 种 情况 是 可 能 的 ， 因 为 5 只 是 部 分 国 数 。 实 际 上 ， 我 们 假定 对 于 任意 的 终 
态 都 没有 定义 其 转移 函数 ， 那 么 当 图 灵机 到 达 终 态 时 ， 也 将 停机 。 口 
例 9.2 考虑 由 
0 = {qo0, 41} 
> = {a,b} 
T= {a,b, DD} 
F= {gq} 


qo, a) = {qo0, b, R} 

6(qo, b) = {qo, b, R} 

dgo, DI) = {4q1, 0, L} 
定义 的 图 灵机 。 如 果 该 图 灵机 的 初 态 为 go， 并 且 读 写 头 位 于 符号 c 上 ， 则 可 以 应 用 转移 函数 
6(go, a) = (qo,b, R)。 因 此 读 写 头 将 a 赫 换 成 bp， 然后 向 右 移动 ， 图 灵机 状态 仍 为 qo。 oa 
意 4 也 将 被 替换 成 0， 而 对 2 将 不 作 任何 改动 。 当 该 图 灵机 读 到 一 个 空白 符 ， 它 将 向 左 移动 一 
单元 ， 然 后 停机 在 终 态 9 上 。 

图 9-3 描 述 了 一 个 简单 初始 格局 迁移 过 程 的 几 个 阶段 。 


a 


图 9-3 迁移 序列 
例 9.3 Q,5,T 采 用 例 9.2 中 的 定义 ， 并 设 F 为 空 ，6 定 义 如 下 


0(qo, a) = {gq1, a, R} 
(go, b) = {qi, b, R} 
(go, D1) = {q1, [DD], R} 








es 
本 
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00q1， a) 三 {9o， a, L} 
6(qi, b) = {gqo, b, L} 
225 (qi1, DD) = {qo, D, L} 


为 了 解 这 里 发 生 的 情况 ， 我 们 可 以 跟踪 一 种 典型 的 情形 。 假 定 初 始 时 带 上 包含 cp…， 并 且 读 
写 头 位 于 ae 上 。 然 后 图 灵机 读 人 aa， 但 并 不 改变 它 。 图 灵机 的 下 一 个 状态 将 转换 为 qi 且 读 写 头 
向 右 移 动 使 之 位 于 上。 接 下 来 这 一 符号 同样 被 读 人 也 不 作 改 变 。 而 图 灵机 将 进入 状态 go 并 且 
读 写 头 向 左 移动 ， 现 在 它 又 回 到 了 初 态 ， 迁 移 序 列 也 将 重新 开始 。 显 见 ， 无 论 带 上 初始 信息 
如 何 ， 该 图 灵机 都 将 不 停 地 工作 ， 使 得 读 写 头 不 断 地 左右 移动 ， 而 对 带 信息 不 作 任 何 改变 。 
这 是 一 个 不 会 停机 的 图 灵机 ， 和 程序 设计 术语 中 的 情况 类 似 ， 我 们 说 图 灵机 进入 了 无 穷 循环 
(infinite loop )。 口 

由 于 图 灵机 存在 多 种 不 同形 式 的 定义 ， 因 而 有 必要 总 结 一 下 我 们 关于 图 灵机 模型 的 主要 
特性 ， 对 于 具备 这 些 特 性 的 图 灵机 ， 我 们 称 之 为 标准 图 灵机 (standard Turing machine)。 图 
灵机 的 主要 特性 有 : 

1. 图 灵机 的 带 在 左右 方向 上 都 没有 限制 ， 允 许 任 意 数 目的 左 迁移 和 右 迁移 .。 

2. 由 于 对 每 一 个 格局 ，6 最 多 只 定义 了 一 种 迁移 ， 因 而 它 是 确定 型 的 。 

3. 没有 特定 的 输入 文件 。 我 们 假定 在 初始 时 刻 ， 带 上 存在 特定 的 内 容 ， 其 中 部 分 内 容 可 
以 作为 图 灵机 的 输入 。 同 样 ， 没 有 特定 的 输出 设备 ， 当 图 灵机 停机 时 ， 带 的 部 分 或 者 全 部 内 
容 可 以 作为 输出 。 

上 述 约定 主要 是 为 了 后 续 讨论 的 方便 。 在 第 10 章 中 我 们 将 看 到 图 灵机 的 其 他 形式 ， 并 上 且 
要 讨论 它们 与 标准 模型 之 间 的 关系 。 

为 了 展示 图 灵机 的 格局 情况 ， 我 们 将 使 用 瞬时 描述 的 概念 。 每 一 个 格局 都 完全 地 由 当前 
控制 部 件 的 状态 、 带 的 内 容 以 及 读 写 头 位 置 决定 。 我 们 采用 形 如 


X14X2 


或 
QI102…G6-19gQkQk+ 1 "a, 
的 表示 形式 ， 它 是 对 处 于 状态 4 且 带 的 内 容 如 图 9-4 所 示 的 图 灵机 的 瞬时 描述 。 其 中 符号 oa，…， 
226| aa, 表示 带 的 内 容 ， 而 4 定义 了 控制 部 件 的 状态 。 这 种 约定 形式 使 得 读 写 头 位 于 紧 跟 在 9 后 的 符 
号 所 在 的 单元 上 。 


内 部 状态 4 





图 9-4 


瞬时 描述 只 给 出 了 读 写 头 左右 有 限 的 信息 。 而 假定 带 上 没有 说 明 的 部 分 为 空白 符 ; 通常 
这 种 空白 是 不 相关 的 ， 并 且 不 在 瞬时 描述 中 予以 显 式 地 说 明 。 但 如 果 空 白 符 的 位 置 与 讨论 相 
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关 ， 则 其 可 以 出 现在 瞬时 描述 中 。 例 如 瞬时 描述 q 口 w 表 示 读 写 头 恰 在 w 左 边 符 号 所 在 的 单元 
上 且 其 内 容 为 空白 符 。 

例 9.4 图 9-3 中 的 几 个 图 片 依次 与 瞬时 描述 序列 qoaa, bqoa, bbqo 品 ,bq15b 对 应 。 

从 一 种 格局 到 另 一 种 格局 的 迁移 可 采用 上 进行 表示 。 因 此 ， 如 果 

(qi1, c) = (q,, e, R) 
则 当 图 灵机 内 部 状态 为 9;/， 带 内 容 为 abcd，、 读 写 头 位 于 c 上 时 ， 将 执行 迁移 
abqicdt- abeqd 

符号 F 通常 表示 任意 数目 的 迁移 ， 而 F w 用 于 区 分 不 同 机 器 上 的 格局 的 迁移 。 口 

例 9.5 图 9-3 中 图 灵机 的 动作 可 以 采用 

doaah bqoa ~ bbqoL HF- bqib 

或 者 qoaaF- bqib 表 示 。 口 

为 了 进一步 讨论 ， 采 用 形式 化 的 方法 概括 观察 到 的 各 种 情况 是 很 方便 的 。 

定义 9.2 设 图 灵机 M = {0, 5, 1, o, do， 口 j， F}, 则 任意 事 01 at 1910404. Dan 其 中 aiET 且 
qiIEQ@， 是 1M 的 一 个 皮 时 描述 。 迁 移 


qar ga as arar DO sia, 
是 可 能 的 ， 当 且 仅 当 

(qu ab = (gq,, b, R) 
迁移 

age aa Da ea 

是 可 能 的 ， 当 且 仅 当 

6(q1, ab = (gq,, b, L) 
针对 某 一 初始 格局 X19x2， 如 果 

X92 y190Y2 

由 于 对 任意 qj 与 49，6(gj, a) 没有 定义 ， 则 M 将 停机 。 我 们 把 导致 停机 状态 的 格局 序列 称 为 计算 


(computation ) 。 
例 9.3 说 明了 图 灵机 未 不 停机 是 可 能 的 ， 可 能 处 于 一 个 无 穷 循 环 处 理 中 。 这 种 情况 在 图 灵 
机 的 讨论 中 起 着 十 分 重要 的 作用 ， 因 此 我 们 对 其 使 用 一 个 特殊 的 表示 法 。 将 其 表示 成 


ge 
它 表 示 着 从 初始 格局 xigxz 开 始 ， 将 不 会 停机 。 
9.1.2 作为 语言 接受 器 的 图 灵机 


在 下 面 的 讨论 中 ， 图 灵机 可 以 被 看 成 识别 器 。 符 号 串 w 被 记录 在 带 上 ， 并 且 其 他 没有 使 用 
的 部 分 为 空 自 符 。 图 灵机 从 初 态 qo 开 始 并 使 读 写 头 位 于 w 的 最 左 符 号 上 。 如 果 通 过 一 系列 的 迁 


kb 


tb 





CO 
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移 ， 图 灵机 最 终 进 入 终 态 并 且 停 机 ， 则 认为 w 能 够 被 接受 。 
定义 9.3 设 M=(Q,>,T, 6, go, 口 , 有 站 是 一 个 图 灵机 ， 则 被 M 接 受 的 语言 为 “ 


L(M) = {wEZ” : qowFF x1qjXx2 对 于 某 个 gjEF， Xi 32EI } 


这 一 定义 表明 输入 串 w 将 被 记录 在 带 上 且 其 两 边 均 为 空白 符 。 将 空白 符 排 除 在 输入 之 外 的 
原因 现在 清楚 了 : 它 保 证 了 所 有 输入 都 被 限制 在 一 个 带 上 明确 定义 的 区 域 中 ， 且 其 左右 均 为 
空白 符 。 如 果 没 有 这 一 约定 ， 图 灵机 将 不 能 限制 输入 串 的 放置 区 域 ; 因而 无 论 读 人 了 多 少 空 
白 符 ， 都 不 能 确定 是 否 在 带 上 还 存在 非 空白 的 输入 。 

定义 9.3 给 出 了 当 wEL(M) 时 将 会 出 现 的 情况 。 而 对 于 其 他 给 入 ， 它 没有 对 结果 给 出 说 明 。 
当 w 不 在 LM) 中 时 ， 可 能 会 发 生 两 种 情况 : 图 灵机 将 在 一 个 非 终 态 下 停机 ， 或 者 将 进入 一 个 
无 穷 循 环 而 永 不 停机 。 根 据 定 义 ， 任 何 使 M 不 会 停机 的 符号 串 都 不 在 LAM) 中 。 

例 9.6 基于 > = {0,1}， 设 计 一 个 图 灵机 ， 它 能 够 接受 正则 表达 式 00* 表 示 的 语言 。 

这 是 图 灵机 程序 设计 的 一 个 简单 习题 。 从 输入 符号 串 的 左 端 开 始 ， 我 们 读 人 每 一 个 符号 
并 检查 它 是 否 为 0。 如 果 是 ， 我 们 将 继续 向 右 迁移 。 如 果 在 到 达 一 个 空白 符 之 前 碰 到 的 都 是 0， 
我 们 将 终止 并 接受 该 符号 串 。 而 如 果 在 输入 中 包含 1， 则 它 不 在 语言 L(00*) 中 ， 图 灵机 将 在 一 
个 非 终 态 下 停机 。 为 了 跟踪 这 一 计算 ， 我 们 只 需 设置 两 个 内 部 状态 8 = {go, 9 小 和 一 个 终 态 严 = 
{9} 就 可 以 了 。 我 们 定义 转移 函数 为 

6(qo, 0) = (qo, 0, R) 
6(go, D) = (g1, DD, 有 


只 要 读 写 头 下 的 符号 为 0， 读 写 头 就 将 向 右 迁 移 。 而 一 旦 读 到 1， 由 于 6(go, 1) 没有 定义 ， 则 图 
灵机 将 在 非 终 态 qgo 下 停机 。 注 意 到 ， 如 果 图 灵机 在 空白 符 上 以 状态 qo 开始 ， 它 也 将 进入 到 终 
态 下 并 停机 。 我 们 可 以 认为 图 灵机 接受 了 A， 但 是 由 于 技术 上 的 原因 ， 定 义 9.3 中 并 没有 包含 
空 串 。 口 
语言 越 复 杂 ， 对 它 的 识别 也 就 越 难 。 由 于 图 灵机 采用 的 是 基本 指令 集 ， 因 此 通过 高 级 语 
言 可 以 简单 编程 的 计算 在 图 灵机 上 通常 就 是 相当 复杂 的 。 尽 管 如 此 ， 在 下 一 个 例子 中 ,我 们 
将 看 到 ， 这 仍然 是 可 能 的 且 其 概念 也 易于 明白 。 
例 9.7 对 = {a,b}， 设计 一 个 图 灵机 ， 它 能 够 接受 
L={a'b":n21} 


直观 上 ， 我 们 可 以 用 下 面 的 方式 来 解决 这 一 问题 。 从 最 左边 的 a 开始 ， 我 们 对 其 进行 核对 并 
以 某 一 符号 比如 x 赫 换 它 。 然 后 我 们 让 读 写 头 继续 右 移 直到 碰 到 最 左边 的 p， 对 它 同 样 进行 核 
对 并 以 某 一 符号 比如 y 蔡 换 它 。 在 这 之 后 ， 我 们 又 左 移 到 最 左边 的 < 上， 用 x 替换 它 ， 然 后 移 至 
最 左边 的 5p， 用 y 替 换 它 ， 依 此 继续 。 通 过 这 种 来 回 移动 ， 对 每 个 4， 我 们 用 5b 去 和 它 匹 配 。 如 
果 最 后 没有 a 和 2 了 ， 则 认为 该 符号 串 一 定 在 语言 上 中 。 
通过 对 上 述 内 容 的 详细 描述 ， 我 们 得 到 一 个 完整 的 解决 方案 ， 其 中 

Q = {qo, 41, 92, 93,94} 

下 = {gq} 

> = {a,b} 

T={a,b,x,y, LL}} 
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它 的 转移 函数 可 以 分 成 几 个 部 分 ， 集 合 
(go, a) = (g,, x, R) 
6(q1, a) = (qi1, a, R) 
dq1, ») 三 (db >, R) 
6(q1, b) = (gq,, y, DL) 


用 x 替换 最 左边 的 a， 然 后 ， 使 读 写 头 右 移 至 第 一 个 b， 并 用 y 替 换 它 。 当 y 被 写 入 带 上 时 ， 图 灵 
机 将 进入 状态 9,， 表 明 一 个 a 已 经 成 功 地 与 一 个 b 相 匹配 了 。 
转移 函数 的 下 一 个 集合 使 读 写 头 向 相反 的 方向 移动 直到 碰 到 一 个 x*， 重 新 将 读 写 头 定位 在 
最 左边 的 a 上， 并 使 控制 返回 到 它 的 初 态 。 
6(q2, y) = (9 >, D) 
6(q,, a) = (q, a, L) 
(gq,, *) = (qo, x, R) 


现在 我 们 回 到 了 初 态 4go。， 为 处 理 下 一 个 4 与 5 做 好 了 准备 。 
在 计算 的 这 一 部 分 执行 完 一 遍 后 ， 图 灵机 将 完成 如 下 的 局 部 计算 


qoaa**…abb:…bk xqoa'…ayb…b 
它 使 得 一 个 a 与 一 个 进行 匹配 。 在 第 二 遍 后 ， 我 们 将 完成 局 部 计算 
goaaabb.bt xxqoayy.…b 


依 此 类 推 ， 可 以 看 出 a 与 bp 的 匹配 过 程 能 够 正确 执行 。 

当 输 入 为 符号 串 a*b" 时 ， 重 写 过 程 将 以 上 述 方式 继续 执行 直到 再 没有 a 可 以 擦 除 为 止 。 这 
时 为 了 找到 最 左边 的 a， 读 写 头 将 在 状态 q; 下 左 移 。 当 碰 到 一 个 + 时 ， 将 逆转 方向 来 读 取 a。 但 
是 现在 ， 不 是 为 了 找到 一 个 4， 而 是 为 了 找到 y。 为 了 终止 ， 将 进行 一 个 终结 检查 ， 以 确认 是 
否 所 有 的 与 2 都 已 经 被 替换 了 (检测 在 输入 中 是 否 一 个 ae 后 有 一 个 5)。 这 可 以 通过 下 式 完成 。 


6(q。， y) 三 (93， 》， RK) 
6(q3, y) = (gs, y, R) 
6(g;, 口 ) 二 (94， 口 ， R) 


如 果 我 们 输入 一 个 不 在 语言 中 的 符号 种， 计算 将 在 一 个 非 终 态 下 停止 。 例 如 ， 如 果 我 们 
输入 a"b"， 其 中 n> m， 则 图 灵机 将 在 状态 gq1 下 碰 到 一 个 空白 符 。 由 于 没有 针对 这 种 情况 定义 
转移 国 数 ， 将 导致 图 灵机 停机 。 其 他 不 在 语言 中 的 符号 串 同 样 将 导致 非 终结 的 停机 状态 (本 
节 习 题 3 ) 。 

对 于 特定 输入 aabb 的 连续 瞬时 描述 序列 如 下 : 

qoaabbl- xgiabbt- xaqibbt-xqyayb 
FF- qsxaybt- xgoaybt- xxqiyb 
Fxxygqibt xxqyyF xqaxyy 
Fxxgoyyt xxyqayt xxyyqs[] 
HFxxyyLlqsD 


kt 
bd 
必 
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针对 上 述 情况 ， 图 灵机 将 在 终 态 下 停机 ， 因 此 符号 串 aappb 能 够 被 接受 。 

为 了 更 好 地 了 解 图 灵机 的 工作 情况 ， 我 们 建议 读者 对 几 个 在 L 中 与 不 在 L 中 的 符号 串 进行 
跟踪 。 口 

例 9.8 设计 一 个 图 灵机 能 够 接受 语言 

L= {ab'"c":n21} 

价 '9.7 中 的 思想 很 容易 用 在 这 里 。 我 们 通过 将 4a，b，c 分 别 替换 成 x, y, z 来 对 其 进行 匹配 。 最 后 ， 
我 们 检查 是 否 所 有 的 原始 符号 都 已 经 被 重 写 了 。 虽 然 这 仅仅 是 对 前 一 例子 的 简单 扩展 ， 但 是 
编写 实际 程序 却 非常 繁琐 。 我们 将 它 留 做 一 个 简单 但 是 有 点 元 长 的 习题 。 注 意 ， 虽 然 {a"b"} 是 
上 下 文 无关 语 言 而 {a"b"c"} 并 不 是 ， 但 是 可 以 采用 结构 非常 类 似 的 图 灵机 接受 它们 。 口 

从 上 例 马 以 得 到 一 个 结论 ， 图 灵机 能 够 识别 不 是 上 下 文 无 关 的 语言 ， 它 的 一 个 最 直接 含 
义 就 是 ， 图 灵机 比 下 推 自动 机 更 强大 。 


9.1.3 作为 转换 器 的 图 灵机 


到 目前 为 止 ， 我 们 似乎 没有 研究 转换 器 的 必要 ， 因 为 在 语言 理论 中 ， 接 受 器 就 已 经 足够 
了 。 但 是 我 们 很 快 就 会 看 到 ， 图 灵机 并 不 仅仅 在 语言 接受 上 有 用 ， 它 同样 为 我 们 提供 了 通用 
电子 计算 机 的 一 个 简单 的 抽象 模型 。 由 于 计算 机 的 基本 目标 在 于 将 输入 转换 为 输出 ， 它 就 像 
一 个 转换 器 的 工作 一 样 。 如 果 我 们 想 要 使 用 图 灵机 为 计算 机 建 模 ， 就 有 必要 深入 了 解 这 一 方 
面 的 情况 。 

一 个 计算 的 输入 就 是 初始 时 刻 带 上 的 非 空白 符号 。 而 计算 完成 时 ， 带 上 所 有 的 符号 就 是 
和 输出。 这 样 ， 我 们 可 以 将 一 个 图 灵机 转换 器 看 成 函数 /的 实现 。/ 定 义 如 下 : 如 果 对 某 一 终 态 
d/， 有 

w= f(w) 


则 
qowt- wm qrw 

定义 9.4 对 定义 域 为 D 的 函数 /， 如 果 存 在 一 个 图 灵机 M = (C,Z,T, 6, qo, 口 , 站 使 得 对 所 

有 的 wED， 都 有 
qowFw qf(w), qfEF 

成 立 ， 则 称 该 溃 数 是 图 灵 可 计算 的 (Turing-computable) 或 可 计算 的 (computable)。 

很 快 我 们 将 得 到 ， 所 有 一 般 性 的 数学 函数 ， 无 论 它 多 么 复杂 ， 都 是 图 灵 可 计算 的 。 首先 ， 
我 们 将 看 几 个 诸如 加 法 和 算术 比较 的 简单 运算 。 

例 9.9 给 定 两 个 正 整 数 x- 和 y， 设 计 一 个 能 够 计算 x + y 的 图 灵机 。 

首先 ， 我 们 需要 选取 菜 一 约定 来 表示 正 整 数 。 为 了 简化 ， 我 们 采用 一 元 表示 法 ， 它 将 任 
意 的 正 整 数 x 表示 成 w(x)E{1}+， 满 足 


[wo)|=x 


同样 ， 我 们 也 将 确定 x 与 y 是 怎样 被 初始 地 放置 在 带 上 的 ， 在 计算 结束 时 ， 它 们 的 和 是 怎 
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样 表 示 的 。 这 里 ,我们 假定 w(x) 与 w(y) 以 一 元 表示 法 放置 在 带 上 并 由 一 个 0 隔 开 ， 同 时 读 写 头 
位 于 w(x) 的 最 左 符号 上 。 计 算 结 束 后 ，w(x + y) 将 以 0 结尾 出 现在 带 上 ， 读 写 头 位 于 结果 的 左 
端 。 因 此 ， 我 们 需要 设计 一 个 图 灵机 来 执行 如 下 计算 

qow(x)O0wOy)F qrw(x + y)0 


其 中 4 是 终 态 。 针 对 这 些 构造 一 个 程序 是 相对 简单 的 。 我 们 需要 做 的 是 首先 将 分 隔 0 移 至 w(y) 
的 右 端 ， 使 得 加 法 就 只 将 两 个 符号 串 进行 连接 ， 此 外 什么 也 不 做 。 为 了 实现 该 程序 ， 我 们 构 
造 M = (8, ,TT， 6, qo, Li], F), 其 中 


Q = {qo0, g1, q2, 93, 94} 
F = {qs} 
(go, 1) = (qo, 1, R) 
6(qo, 0) = (qi, 1, R) 
dq1, 1) = (qi, 1, R) 
(qi, [1]) = (4 DD, D) 
56(92 1) = (93, 0, L) 
dg;, 1) = (qs, 1, L) 
(qs, D) = (94 DJ, R) 
注意 ， 在 我 们 将 0 向 右 移 时 ， 临 时 创建 了 一 个 1， 这 一 情况 通过 将 图 灵机 置 于 状态 4 来 进行 记 
录 。 计 算 结 束 时 ， 需 要 使 用 转移 函数 6(9,, 1) = (9j, 0, R) 消除 它 。 这 可 以 从 如 下 1 加 11 的 瞬时 
描述 序列 中 看 出 : 
doll11011H 1gol1011HF- 11go1011H-111g0o011 
FililgllF11llllg1lt111111g 口 
-11il111921HF-11119310 


Fg O111110F gy111110 
虽然 一 元 表示 法 对 于 实际 的 计算 比较 繁琐 ， 但 对 于 图 灵机 编程 它 是 方便 的 。 通 过 它 得 到 的 结 
果 程 序 比 采 用 其 他 表示 法 ， 如 二 进 制 或 者 十 进 制 要 简短 得 多 。 口 


加 法 是 任何 计算 机 的 基本 操作 之 一 ， 它 可 以 作为 更 加 复杂 指令 合成 的 组 成 部 分 。 其 他 的 
基本 操作 还 有 拷贝 符号 串 及 简单 比较 ， 它 们 也 很 容易 通过 图 灵机 实现 。 

例 9.10 ”设计 一 个 图 灵机 用 于 拷贝 由 1 构成 的 符号 串 。 更 准确 地 说 ， 也 就 是 构造 一 个 机 器 
能 够 执行 计算 


GowE gqww 


其 中 wE{1}*。 
为 了 解决 这 一 问题 ， 我 们 实现 如 下 的 直观 过 程 : 
1. 用 x 替换 每 一 个 1。 
2. 找到 最 右边 的 zx， 用 1 替换 它 。 
3. 移 至 当前 带 上 非 空 区 域 的 最 右 端 ， 并 创建 一 个 1。 
4. 重复 步骤 2 与 3 直到 再 也 没有 x 为 止 。 


ktD 
wy 
bd 
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实现 它 的 一 个 图 灵机 为 
(qo, 1) = (go, x, R) 
Go LL)) = (qi1, [1, DL) 
(qi, 7*) = (gq,, 1, R) 
gq,, 1) = (gq,, 1, R) 
Gd L1) = (gi, 1, L) 
dq, 1) = (qi, 1, 7) 
qi, [1) = (qs, D, R) 
其 中 93 是 唯一 的 终 态 。 首 先 ， 要 理解 它 是 有 点 难度 的 ， 我 们 可 以 用 简单 的 符号 串 11 来 跟踪 该 
程序 ， 这 种 情况 下 ， 计 算 执行 如 下 : 
GdollH xqolt- xxqoL]l- xgyx 
FxiqsL xgillt gx1l 
F-19211H-11g,1t 11192 口 ] 
Fllgqilit1g111 
Fagllilltg Dllllt gl111 口 


例 9.11 设 x 与 y 是 采用 一 元 表示 法 表示 的 两 个 正 整 数 。 构 造 一 个 图 灵机 使 得 如 果 x>y， 则 
在 终 态 49, 下 停机 ， 而 如 果 x<y， 则 在 非 终 态 4, 下 停机 。 更 为 形式 化 业 ， 也 就 是 使 得 该 机 器 能 够 
执行 计算 

qdow(Cx)OwO)F gw(C)0w(y)， 如 果 x>y 
qow(X)0wO)F q,w(x)0w(y)， 如 果 x <y 

为 了 解决 这 一 问题 ， 我 们 可 以 对 例 9.7 中 的 思想 做 一 些小 的 修改 。 不 匹配 4 与 5»， 而 匹配 分 
隔 符 0 左边 的 1 与 右边 的 1。 通 过 匹配 ， 在 带 上 我 们 可 以 根据 x >y 还 是 y> x 得 到 结果 

xXx 110xx…x[] 


或 者 
xXx."XXOxx.…xl11[ ] 


在 第 一 种 情况 下 ， 当 我 们 试图 匹配 下 一 个 1 时 ， 在 工作 空间 的 右 端 碰 到 了 空白 符 ， 它 可 以 作为 
图 灵机 进入 状态 4, 的 信号 。 在 第 二 种 情况 下 ， 当 左边 的 1 都 被 赫 换 完 后 ， 右 边 仍然 有 1， 这 种 
情况 下 图 灵机 将 进入 状态 9,。 针 对 这 一 计算 的 完整 程序 很 简单 ， 我 们 将 其 留 为 习题 。 

通过 这 个 例子 可 以 得 到 一 个 重要 的 结论 ， 可 以 给 图 灵机 编程 ， 使 它 能 根据 算术 比较 进行 
决策 。 这 种 简单 的 决策 在 计算 机 的 机 器 语言 中 是 常见 的 ， 它 根据 算术 运算 的 结果 选择 进入 分 


支 指令 流 。 . 口 
习题 
碌碌 1. 使 用 高 级 程序 设计 语言 设计 一 个 图 灵机 模拟 器 。 该 模拟 器 能 够 以 任何 图 灵机 的 描述 和 


一 个 初始 格局 作为 输入 ， 并 输出 相应 的 计算 结果 。 
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.设计 一 个 状态 个 数 不 超 过 3 的 图 灵机 ， 它 能 够 接受 语言 L(ala + 5))。 如 果 假 定 > = {a, 5}， 两 
状态 的 图 灵机 是 否 能 够 接受 该 语言 7 区 
在 例 9.7 中 ， 如 果 输 入 的 是 aba 与 aaabbbb， 说 明 该 图 灵机 是 如 何 工作 的 。 
在 例 9.7 中 ， 是 否 存在 输入 使 该 图 灵机 进入 无 穷 循环 ? 
. 确定 由 图 灵机 M = ({4o, 91, 942,93}, {a,b5}, {a,b, 癌 }, 6, qo, 口 , {93)) 接 受 的 语言 ， 其 中 
(qo, a) = (qi, a, R) 
(go, b) = (gq,, b, R) 
6(qi, b) = (qi1, b, R) 
6(gq1, [1]) = (qs, DD, R) 
6(gq,, b) = (gq,, b, R) 
6(g,, a) = (qi a, R) 


.在 例 9.10 中 ， 如 果 符 号 串 w 中 包含 1 以 外 的 符号 ， 将 会 发 生 什么 情况 ? 
. 为 如 下 基于 {a, 5} 的 语言 构造 图 灵机 : 

(a) 工 = L(aba'b) 郊 

(b) 工 = {w : |w| 是 偶数 } 大 

(oc) 工 = {w : |w| 是 3 的 倍数 } 

(d)L={ab"”":n21,nzzm} 

(©) L= {w :nw) = n,(w)} 

( 们 元 = {a ba'™”:n20,m21} 

(g) L= {a"b’a"b" :n>0} 

(hD)L={ab”:n21} 

对 于 上 述 每 一 个 问题 ， 给 出 6 的 详细 内 容 ， 然 后 通过 跟踪 几 个 测试 实例 来 检验 答案 。 
. 设计 图 灵机 使 之 能 够 接受 语言 


iD 


59 


wn 下 


~ 个 


oo 


L= {ww : wEf{a, b}!} 
9. 构造 图 灵机 使 之 能 计算 函数 
f(w) = we 
其 中 wE{0, 1}'。 


10. 设计 一 个 图 灵机 ， 它 能 够 找到 偶数 长 度 符号 串 的 中 间 位 置 。 例 如 ， 如 果 w = ajay…asas ,1… 


an 且 wE2z ， 则 图 灵机 将 输出 结果 Ww = aa …ausca ay 其 中 cET -了 。 春 
11. 设计 一 批 能 计算 如 下 函数 的 图 灵机 ， 其 中 x 与 y 是 正 整 数 且 采用 一 元 表示 法 。 
(a) f(x) = 3x 
(b) f(x,y)=x-y, x>y 
= 0， XYy 
(Cc) f(x,y) = 2x+ 3y 


(d) f(x) = 7 如 果 x 是 偶数 
x 


| 
~ 
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(e) f(x)=x mod5 
(Df09 = | 半 ， 其 中 | 表示 小 于 或 者 等 于 之 的 最 大 整数 


. 设计 一 个 图 灵机 ， 共 中 T= {0, 1, 口 }， 使 得 如 果 图 灵机 开始 于 任意 包含 空白 符 或 1 的 单元 ， 

则 当 且 仅 当 带 上 有 一 个 0 时 ， 它 才 停 机 。 葡 

13. 写 出 例 9.8 的 完整 解决 方案 。 

14. 针对 例 9.10 中 的 图 灵机 ， 当 输入 为 111 时 ， 给 出 相应 的 瞬时 描述 序列 。 当 输入 为 110 时 ， 情 
况 又 会 怎样 ? 

15. 证 明 例 9.10 中 的 图 灵机 确实 能 够 执行 指定 的 计算 。 

16. 给 出 例 9.11 的 详细 内 容 。 

17. 假定 在 例 9.9 中 ，x 与 y 以 二 进 制 作为 表示 法 ， 设 计 一 个 图 灵机 能 够 在 该 表示 法 下 完成 指定 的 
计算 。 

18. 如 果 例 9.9 中 ，x* 与 ?采用 十 进 制 表示 法 ， 给 出 针对 它 的 解决 方案 梗概 。 

19. 注意 到 本 节 实 例 中 的 图 灵机 都 仅 有 一 个 终 态 。 是 否 存在 一 般 性 的 结论 : 对 于 任意 的 图 灵机 ， 
都 存在 另 一 个 只 有 一 个 终 态 的 图 灵机 能 够 接受 同样 的 语言 。 沉 

20. 在 定义 9.2 中 ， 图 灵机 接受 的 语言 不 包含 空 申 。 试 改变 该 定义 使 之 能 够 接受 包含 有 4 的 语 








一 
Lo] 


Ml 


9.2 完成 复杂 任务 的 组 合 图 灵机 


我 们 已 经 明确 说 明了 所 有 那些 计算 机 中 都 提供 的 重要 操作 是 怎样 通过 图 灵机 实现 的 。 既 
然 在 数字 计算 机 中 ， 这 些 基 本 操作 是 组 成 更 为 复杂 指令 的 构造 块 ， 那 么 让 我 们 来 看 看 这 些 基 
本 操作 在 图 灵机 中 是 怎样 组 合 在 一 起 的 。 为 了 说 明 图 灵机 是 如 何 组 合 的 ， 我 们 将 遵循 程序 设 
计 中 的 一 个 共同 惯例 。 从 程序 的 一 个 高 层 描述 开始 ， 不 断 地 细 化 ， 直 到 程序 能 够 用 我 们 使 用 
的 实际 语言 描述 为 止 。 我 们 能 够 以 多 种 方式 在 高 层 描述 图 灵机 ， 后 续 的 讨论 中 ， 我 们 将 主要 
以 块 图 或 伪 码 作为 描述 方式 。 在 块 图 中 ， 我 们 将 计算 封装 在 盒子 中 ， 并 描述 了 它 的 功能 ， 但 
其 内 部 细节 是 不 可 见 的 。 通 过 使 用 这 种 盒子 ， 我 们 已 经 隐 含 地 表明 了 它们 确实 是 可 以 构造 的 。 
作为 第 一 个 例子 ， 我 们 把 例 9.9 与 例 9.11 中 的 图 灵机 加 以 组 合 。 
例 9.12 设计 一 个 图 灵机 能 够 计算 函数 
f(x,y)=xX+y， 如果 x>y 
= 0， 如 果 x <y 


为 了 使 于 讨论 ， 我 们 假定 x 与 都 是 正 整 数 并 且 采 用 一 元 表示 法 。 值 零 将 在 带 上 表示 成 0 且 带 上 
采用 基于 图 的 高 层 描述 方式 ，f(x, y) 的 计算 可 以 可 视 化 地 表示 为 图 9-5。 在 该 图 中 ， 我 们 
将 首先 使 用 一 个 类 似 例 9.11 中 的 比较 机 器 来 确定 是 否 有 xz > y。 如 果 x> y， 则 比较 器 给 加 法 器 发 
一 个 开始 信号 ， 开 始 计算 xz + y。 否 则 ， 启 动 一 个 按 除 程序 ， 将 所 有 的 1 替换 成 空白 符 。 
在 接 下 来 的 讨论 中 ， 我 们 将 经 常 使 用 图 灵机 的 这 种 高 层 的 块 图 表示 形式 。 这 比 用 相应 6 的 
扩展 集合 更 加 快捷 、 清 楚 。 在 我 们 接受 这 一 高 层 视 图 之 前 ， 首 先 需要 验证 它 的 可 行 性 ， 比 如 
比较 器 给 加 法 器 发 送 一 个 开始 信号 到 底 是 什么 意思 ? 定义 9.1 没 有 对 这 种 可 能 性 给 出 说 明 。 然 
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而 我 们 可 以 通过 一 种 简单 的 方式 来 进行 说 明 。 





图 9-5 


比较 器 C 的 程序 是 根据 例 9.11 进 行 编写 的 ， 使 该 图 灵机 的 状态 下 标 为 C。 对 于 加 法 器 ， 我 
们 使 用 例 9.9 中 的 思想 并 使 自动 机 的 状态 下 标 为 4。 而 对 于 撩 除 器 已 ， 我 们 构造 了 一 个 状态 下 标 
为 E 的 图 灵机 。 由 C 完 成 的 计算 是 
qc.ow(X)0wO)F ga.ow(x)0w(y)， 如 果 x >y 
与 
gc.ow(X)0w(y)F gg.ow(X)0w(y)， 如 果 x <y 


如 果 我 们 分 别 以 qu "与 az o 作 为 4 与 的 初 态 ， 可 以 看 出 C 将 启动 4 或 者 E。 


由 加 法 器 完成 的 计算 为 
qa.ow OwOF qa w(x + yO 
而 擦 除 器 E 将 完成 
qz.ow(x)0w(y)F qs. 0 
结果 将 得 到 单个 图 灵机 ， 如 图 9-5 所 示 ， 它 组 合 了 C，4 与 E 的 工作 。 口 


图 灵机 另 一 个 有 用 的 高 层 视图 是 采用 伪 码 作为 描述 。 在 计算 机 程序 设计 中 ， 伪 码 采 用 一 
些 易 于 理解 的 描述 性 词汇 简要 地 描述 一 个 计算 。 然 而 ， 这 种 描述 在 计算 机 中 是 不 可 用 的 ， 但 
我 们 假定 它 能 够 转换 成 一 种 我 们 需要 的 合适 语言 。 可 以 用 宏 指令 做 例子 来 介绍 一 种 简单 的 伪 
码 ， 宏 指令 是 单个 语句 的 缩写 ， 但 是 代表 了 一 个 低层 语句 的 序列 ! 首先 ， 我 们 根据 低层 语言 
定义 宏 指 令 ， 并 假定 相关 的 低层 代码 将 替换 该 宏 指令 的 每 一 次 出 现 ， 这 样 就 可 以 在 程序 中 使 
用 宏 指令 了 。 这 一 思想 在 图 灵机 程序 设计 中 非常 有 用 。 

例 9.13 考虑 宏 指令 


if a then gj else qi 


它 的 含义 是 : 如 果 图 灵机 读 到 a， 无 论 当前 处 于 什么 状态 ， 都 将 进入 状态 q9;， 且 不 改变 带 的 内 
容 或 读 写 头 的 位 置 。 如 果 读 到 的 符号 不 是 a， 该 图 灵机 将 进入 状态 qg;， 同 样 不 改变 带 的 内 容 或 
读 写 头 的 位 置 。 
实现 该 宏 指令 只 需要 图 灵机 的 几 个 简单 相关 操作 : 

6(gqi, a) = (qn, a, R) 对 任意 的 MEOC 

6(qi,b) = (qio,b, R) 对 任意 的 g,EQ 及 任意 的 bET - {a} 

6(qn, c) = (qj; c, L) 对 任意 的 ceT 

6(quo, c) = (qc,L) 对 任意 的 cET 
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状态 qn 与 9io 是 新 引入 的 状态 ， 它 们 用 于 处 理 标 准 图 灵机 中 每 一 步 迁 移 读 写 头 都 将 移动 这 一 事 
实 所 带 来 的 问题 ， 因 为 在 该 宏 指令 中 ， 我 们 需要 改变 状态 但 不 移动 读 写 头 。 这 样 就 可 以 先 让 
读 写 头 右 移 并 使 图 灵机 进入 状态 4n 或 者 ge， 也 就 使 得 在 进入 要 求 的 状态 49/ 或 者 4 之 前 需要 执行 
一 次 左 移 。 口 

我 们 可 以 进一步 使 用 子 程序 来 替换 宏 指 令 。 一 般 而 言 ， 宏 指令 在 其 每 次 出 现 的 地 方 将 会 
被 实际 代码 替换 ， 而 子 程序 作为 一 段 代 码 块 ， 可 以 在 需要 的 地 方 被 反复 地 调用 。 子 程序 是 高 
级 程序 设计 语言 的 基本 成 分 ， 它 同样 可 以 用 在 图 灵机 中 。 为 了 说 明 其 合理 性 ， 我 们 将 简要 地 
描述 一 个 图 灵机 是 怎样 作为 一 个 子 程序 被 其 他 图 灵机 反复 调用 的 。 这 里 图 灵机 需要 一 个 新 特 
性 : 能 够 存储 调用 程序 的 格局 信息 ， 使 得 从 子 程序 返回 时 能 够 重建 该 格局 。 例 如 ， 图 灵机 A 在 
状态 q; 下 调用 图 灵机 8。 当 8B 完成 时 ， 我 们 将 希望 在 状态 q; 下 恢复 程序 4， 并 使 得 其 读 写 头 ( 它 
可 能 在 8 的 操作 中 发 生 了 移动 ) 保持 原来 的 位 置 。 其 他 时 候 ，A 可 能 会 在 状态 q; 下 调用 B， 调 用 
完成 后 ， 控 制 应 该 返回 到 状态 g;， 为 了 解决 这 一 控制 转移 问题 ， 我 们 必须 能 够 从 4 到 8B、 从 8 到 
4 地 传递 信息 并 且 保 证 临时 挂 起 的 计算 4 不 会 受 正在 执行 的 8 的 影响 。 为 了 能 这 么 做 ， 我 们 将 
带 分 成 如 图 9-6 所 示 的 几 个 区 域 。 
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在 4 调用 B8 之 前 ， 它 在 带 区 域 T7 中 放置 8 需要 的 信息 (比如 4 的 当前 状态 ，B 的 参数 等 )。 
然后 4 通过 一 个 转移 函数 进入 B 的 开始 状态 并 将 控制 交 给 8。 在 转移 完成 后 ，8 将 在 T 中 找到 
其 相应 的 输入 。 由 于 8 的 工作 空间 与 7 以 及 4 的 工作 空间 是 分 开 的 ， 所 以 它们 之 间 不 会 出 现 干 
扰 。 当 8 完成 时 ， 它 将 相关 的 结果 返回 到 区 域 7 中 ，4 将 在 这 里 找到 相应 的 信息 。 通 过 这 种 方 
式 ， 这 两 个 程序 能 够 以 所 需 的 方式 相互 作用 。 可 以 看 出 这 与 实际 计算 机 中 的 子 程序 调用 十 分 
类 似 。 

现在 ， 如 果 我 们 知道 (至少 在 理论 上 知道 ) 怎样 将 伪 码 转换 成 一 个 实际 的 图 灵机 程序 ， 
就 可 以 采用 伪 码 对 图 灵机 进行 编程 了 。 

例 9.14 设计 一 个 图 灵机 ， 它 能 够 将 两 个 以 一 元 表示 法 表示 的 正 整数 相 乘 。 

乘法 图 灵机 可 以 通过 组 合 加 法 与 拷贝 的 思想 来 进行 了 构造 。 我 们 假定 初始 与 最 终 的 带 内 容 
如 图 9-7 所 示 。 乘 法 过 程 可 以 被 看 成 是 对 于 乘 数 x 中 每 一 个 1 重复 地 拷贝 被 乘 数 y 的 过 程 ， 使 得 
符号 串 ? 每 次 都 能 够 加 入 到 部 分 的 计算 乘积 中 。 下 面 的 伪 码 说 明了 该 过 程 的 主要 步骤 : 

1. 重复 下 述 过 程 直到 x 中 没有 1 为 止 : 

在 x 中 找 一 个 1 并 用 另 -个 符号 a 替换 它 ; 

将 最 左边 的 0 替换 成 0y。 

2. 将 所 有 的 a 替换 成 1。 

尽管 上 述 伪 码 很 简略 ， 它 的 思想 也 足够 简单 ， 但 却 可 以 毫 无 疑问 地 完成 计算 。 口 
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图 严 机 
oo 
Cv/ \ 一 -一 一 一 一 一 -一 -一 一 一 一 -一 一 一 
了 x Xxy 了 x 


图 9-7 


无 论 这 些 例子 采用 了 什么 样 的 描述 方式 ， 我 们 都 可 以 据 其 推测 : 基本 的 图 灵机 能 够 以 多 
种 方式 组 合 而 使 其 非常 强大 。 但 同时 由 于 我 们 给 出 的 例子 不 是 一 般 性 的 ， 也 不 足够 详细 ， 因 
此 我 们 也 就 不 能 说 通过 它们 得 到 了 什么 证 明 。 但 对 于 图 灵机 可 以 完成 一 些 非常 复杂 的 事情 这 
一 论点 ， 我 们 似乎 是 可 以 接受 的 。 


习题 


.给 出 例 9.14 的 完整 解决 方案 。 
给 出 一 元 表示 法 表示 正 负 整数 的 约定 。 基 于 这 一 约定 ， 概 述 用 于 计算 x ~ ?的 减法 器 的 构造 。 
-利用 加 法 器 、 减 法 器 、 找 贝 器 、 比 较 器 以 及 乘法 器 ， 画 出 能 够 计算 如 下 函数 的 图 灵机 块 图 。 
其 中 n 是 正 整 数 。 
(a) Fo = nn + 1) 车 
(b) f(n) = 天 
(cJ 7COD = 2 
(d) fl(n)=n! 
(©) f (1) =n" 
. 使 用 块 图 概要 地 描述 函数 的 实现 ，f 定 义 如 下 : 对 于 所 有 mw, wa, w3E{1}*， 有 


fwi, Wa, wa) =i 


其 中 i 油 足 [wi| = max (wil, [wzl, ws|)) ， 条 件 是 没有 两 个 w 的 长 度 是 相间 的 ; 否则 i=0。 
.给 出 在 {a, b} 上 能 够 接受 如 下 语言 的 图 灵机 的 高 层 描述 ， 并 对 每 一 个 问题 定义 一 组 合适 的 且 

易于 实现 的 宏 指令 集合 ， 并 在 高 层 描述 的 解决 方案 中 使 用 它们 。 

(a) 工 = {ww*} 

(b)L= {ww :wwa wi| = |w,l} 

(c) (a) 中 语言 的 补 辣 

(dL= {ab" :m=n,n>1} 

(e) 工 = {a" : n 是 一 个 质数 } 
6. 给 出 用 图 灵机 表示 有 理 数 的 方法 ， 在 此 基础 上 概述 如 何 针对 这 些 数 执行 加 法 与 减法 操作 。 
7. 概述 能 够 对 十 进 制 表示 的 正 整 数 * 与 ?执行 加 法 与 乘法 操作 的 图 灵机 的 结构 。 
8. 给 出 宏 指 令 


fi 一 


pS 


Cn 


searchright (a, q;, 9 


的 实现 。 该 指令 用 于 从 带 的 当前 位 置 向 右 搜 索 第 一 个 符号 a， 如 果 在 一 个 空白 符 出 现 之 前 磁 到 
a, 则 该 图 灵机 将 进入 状态 9,， 否则 进入 状态 qi。 入 
9. 使 用 习题 8 中 的 宏 指令 设计 一 个 基于 2 = {a, 5b} 的 图 灵机 能 够 接受 语言 L(ab'ab'*a)。 


LN 


[wg 
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10. 使 用 习题 8 中 的 宏 指 令 创 建 一 个 图 灵机 , 它 能 够 将 最 左边 的 a 左边 紧邻 的 符号 替换 成 空白 符 。 
如 果 输 入 中 没有 a， 则 最 右 的 非 空白 符号 被 替换 成 2。 


9.3 图 灵 论 题 


前 述 讨论 不 仅 说 明 图 灵机 能 够 利用 一 些 比 较 简 单 的 部 件 进行 构造 ， 而 且 也 说 明了 采用 这 
种 低级 自动 机 进行 工作 的 不 方便 之 处 。 将 块 图 或 者 伪 码 转换 成 相应 的 图 灵机 程序 几乎 不 需要 
什么 想像 力 与 创造 性 ， 它 只 是 一 个 耗 时 且 容 易 犯 错 的 过 程 ， 而 对 我 们 的 理解 没有 什么 帮助 。 
由 于 图 灵机 指令 集合 的 限制 过 于 严格 ， 使 得 对 任何 稍 复杂 一 点 的 问题 ， 它 们 的 解决 方案 与 证 
明 都 将 非常 繁琐 。 

现在 我 们 面临 一 个 两 难 的 处 境 : 为 了 说 明 图 灵机 不 仅 能 执行 一 些 可 以 明确 给 出 程序 的 
简单 操作 ， 而 且 也 能 解决 一 些 可 用 块 图 或 伪 码 描述 的 更 为 复杂 的 问题 ， 我 们 需要 明确 地 给 
出 相应 程序 ， 而 这 却 是 一 件 痛苦 且 没 有 任何 吸引 力 的 工作 ， 可 能 的 话 ， 应 该 避免 这 么 做 。 
因此 ， 我 们 希望 能 够 找到 一 种 关于 图 灵机 的 合理 的 严格 讨论 ， 而 又 不 需要 编写 宛 长 而 低级 
的 代码 。 不 幸 的 是 ， 还 没有 一 种 完美 的 方案 能 够 使 我 们 摆脱 这 样 的 困境 ; 我 们 只 能 对 此 给 
出 一 个 合理 的 折 中 方案 。 为 了 说 明 我 们 是 怎样 得 到 这 一 折 中 方案 的 ， 我 们 将 转向 有 点 哲学 
性 的 话题 。 

从 前 一 节 的 例子 中 ， 我 们 可 以 得 到 一 些 简单 的 结论 。 第 一 点 就 是 图 灵机 比 下 推 自动 机 更 
为 强大 (对 于 这 点 的 讨论 ， 见 本 节 后 边 的 习题 2)。 例 9.8 对 一 个 非 上 下 文 无 关 语 言 ， 概 述 了 接 
受 它 的 图 灵机 的 构造 ， 但 不 存在 下 推 自动 机 能 够 接受 这 个 语言 。 而 例 9.9、 例 9.10 与 例 9.11 说 
明了 图 灵机 能 够 完成 一 些 基本 的 算术 运算 ,符号 串 处 理 以 及 一 些 简 单 的 比较 。 同 样 也 说 明了 
基本 操作 是 怎样 组 合 起 来 解决 更 为 复杂 的 问题 的 ， 多 个 图 灵机 是 怎样 组 合 起 来 的 以 及 一 个 程 
序 是 怎样 作为 另 一 个 程序 的 子 程序 的 。 由 于 图 灵机 具备 这 种 建立 复杂 操作 的 方法 ， 我 们 猜想 
图 灵机 在 功能 上 能 够 与 一 个 典型 的 计算 机 相当 。 

我 们 可 能 在 某 种 意义 上 推测 图 灵机 在 功能 上 与 典型 的 电子 计算 机 是 等 价 的 。 但 我 们 怎样 
能 证 明 或 者 反驳 它 昵 ?对 于 证 明 ， 我 们 可 能 会 采用 一 系列 更 为 复杂 的 问题 来 说 明 图 灵机 是 怎 
样 解决 它们 的 。 我 们 也 可 能 选取 某 一 特定 计算 机 的 机 器 语言 指令 集 ， 然 后 设计 一 个 图 灵机 使 
其 能 够 执行 该 集 合 中 的 所 有 指令 。 毫 无 疑问 ， 这 么 做 需要 巨大 的 耐心 ， 但 如 果 这 一 假定 是 正 
确 的 ， 也 是 可 以 这 么 做 的 。 在 这 一 方向 上 的 每 一 个 成 功 都 能 进一步 验证 我 们 的 推测 ， 但 它 并 
不 能 够 证 明 。 困 难 在 于 我 们 并 不 能 准确 地 知道 什么 是 “典型 的 数字 计算 机 ”， 也 无 法 给 出 它 的 
准确 定义 。 

我 们 也 可 以 从 另 一 个 方面 来 解决 这 一 问题 。 努 力 找 出 一 些 过 程 ， 对 这 些 过 程 能 够 编写 出 
相应 的 计算 机 程序 ， 如 果 设 有 相应 的 程序 则 表明 ， 这 些 过 程 不 存在 相应 的 图 灵机 。 如 果 能 够 
找到 没有 相应 程序 的 过 程 ， 我 们 就 有 了 反驳 这 一 推测 的 根据 。 但 是 ， 目 前 还 没有 人 能 够 找到 
这 样 的 一 个 反例 ， 所 有 的 这 种 尝试 都 失败 了 ， 这 个 事实 可 以 作为 例证 来 说 明 是 不 可 能 找到 这 
样 的 反例 的 。 所 有 的 这 些 都 在 说 明 着 图 灵机 与 任何 计算 机 基本 上 是 同样 强大 的 。 

对 这 一 类 型 问题 的 争论 ， 导 致 A. M. Turing 和 其 他 的 一 些 计算 机 科学 家 在 20 世 纪 30 年 代 中 
期 给 出 了 称 为 图 灵 论 题 (Turing thesis) 的 著名 猜想 。 该 猜想 认为 任何 可 以 采用 机 械 方 式 完成 
的 计算 都 可 以 采用 图 灵机 来 完成 。 
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这 是 一 个 总 括 性 的 陈述 ， 因 此 对 我 们 而 言 ， 了 解 图 灵 论 题 是 很 重要 的 。 但 它 还 没有 得 到 
证 明 。 要 想 证 明 这 个 论题 ， 我 们 需要 准确 地 定义 术语 “机 械 方式 ”， 为 此 ， 需 要 某 种 其 他 的 抽 
象 模型 ， 而 这 使 得 我 们 无 法 前 行 。 将 图 灵 论 题 看 成 是 对 机 械 计算 的 定义 将 更 为 合理 ， 而 一 个 
计算 被 称 之 为 机 械 计算 当 且 仅 当 它 能 够 被 某 一 图 灵机 执行 。 

如 果 我 们 相信 这 一 观点 并 简单 地 认为 图 灵 论 题 是 一 个 定义 ， 则 对 这 一 定义 是 否 足 够 的 宽 
泛 ， 我 们 将 提出 一 些 问题 。 是 否 它 能 够 覆盖 我 们 现在 采用 计算 机 能 完成 (以 及 在 未 来 可 能 的 ) 
的 所 有 事情 ?对 此 ， 还 没有 一 个 明确 的 肯定 回答 ， 但 是 存在 一 些 很 强 的 、 有 利于 它 的 证 据 。 
对 于 接受 图 灵 论 题 作为 机 械 计算 的 定义 ， 我们 存在 如 下 一 些 论点 : 

1. 任何 能 够 被 现 有 数字 计算 机 完成 的 事情 ， 图 灵机 同样 可 以 完成 。 

2. 到 目前 为 止 ， 还 没有 人 能 够 给 出 这 样 一 个 问题 ， 它 能 通过 我 们 直观 上 能 够 想到 的 算法 
进行 解决 ， 却 写 不 出 它 相应 的 图 灵机 程序 。 

3. 曾经 提出 的 一 些 其 他 机 械 计算 模型 ， 都 不 比 图 灵机 更 强大 。 

这 些 论据 都 是 基于 具体 情况 的 ， 因 而 图 灵 论 题 并 不 能 由 此 得 到 证 明 。 尽 管 图 灵 论 题 看 起 
来 是 合理 的 ， 但 它 仍 是 一 个 假设 。 将 图 灵 论 题 简单 地 看 作 是 一 个 定义 会 遗漏 一 个 重要 的 论点 ， 
那 就 是 在 某 种 意义 上 ， 图 灵 论 题 在 计算 科学 中 发 挥 的 作用 就 像 化 学 与 物理 中 的 基本 规律 一 样 。 
比如 ， 经 典 物 理学 主要 是 基于 牛顿 运动 定律 。 虽 然 我 们 称 之 为 定律 ， 但 它们 并 没有 逻辑 上 的 
必然 性 ， 更 确切 地 说 ， 这 些 似 是 而 非 的 理论 能 够 解释 物理 世界 中 的 大 部 分 现象 。 由 于 根据 它 
们 得 到 的 结论 与 我 们 的 经 验 以 及 观察 相符 合 ， 因 而 我 们 接受 了 它们 。 但 我 们 并 不 能 证 明 这 些 
规律 是 正确 的 ， 尽 管 它们 甚至 可 能 是 错误 的 。 如 果 一 个 实验 的 结果 与 根据 这 些 规律 得 到 的 结 
论 冲 突 ， 我 们 就 会 对 其 有 效 性 提出 怀疑 。 另 一 方面 ， 试 图 推翻 一 个 规律 的 努力 反复 失败 增强 
了 我 们 对 这 个 规律 的 信心 。 图 灵 论 题 也 是 同样 的 情况 ， 因 此 我 们 有 理由 将 其 作为 计算 机 科学 
的 一 条 基本 规律 。 从 它 得 到 的 结论 与 现实 计算 机 得 到 的 结论 是 符合 的 ， 而 且 到 目前 为 止 ， 很 
多 试图 推翻 这 一 规律 的 尝试 都 失败 了 。 也 许 有 一 天 有 人 能 够 给 出 一 个 新 的 定义 ， 它 能 够 解决 
一 些 图 灵机 所 不 能 解决 的 问题 ,但 目前 ， 这 仍 不 在 我 们 对 于 机 械 理论 认识 的 直观 概念 范围 之 
内 。 如 果 出 现 这 种 情况 ， 则 我 们 接 下 来 的 很 多 讨论 都 需要 做 重大 的 修改 ， 但 这 种 情况 的 可 能 
性 很 小 。 

如 有 果 我 们 接受 图 灵 论 题 ， 现 在 就 能 够 给 出 算法 的 准确 定义 了 。 

定义 9.5 实现 函数 三 D-R 的 算法 是 一 个 图 灵机 M， 它 以 带 上 的 任意 dED 作 为 输入 ， 最 终 
以 带 上 的 正确 结果 f(d)ER 作 为 输出 并 停机 。 形 式 化 地 ， 我 们 可 以 要 求 对 于 所 有 的 dED， 有 


goad- 1 qf(d), gq; EF 


采用 图 灵机 程序 来 识别 一 个 算法 ， 我 们 就 能 够 严格 地 证 明 诸如 “存在 一 个 算法 ”或 者 
不 存在 一 个 算法 ”这 样 的 命题 。 然 而 ， 要 明确 构造 一 个 算法 来 解决 相对 简单 的 问题 都 将 是 一 
件 繁琐 的 工作 。 为 了 避免 这 种 情况 ， 我 们 就 可 以 根据 图 灵 论 题 宣称 ， 在 任何 计算 机 上 可 以 完 
成 的 事情 同样 可 以 在 图 灵机 上 完成 。 因 而 ， 我 们 也 就 能 够 在 定义 9.5 中 使 用 “Pascal 程 序 ” 赫 
换 “ 图 灵机 ”， 这 将 明显 减轻 给 出 相关 算法 的 负担 。 实 际 上 ， 我 们 已 经 这 么 做 了 ,更 进一步 地 ， 
假设 对 于 口头 描述 或 块 图 ， 我 们 能 够 根据 需要 给 出 与 它们 相应 的 图 灵机 程序 ， 我 们 就 能 接受 
其 为 算法 。 这 大 大 简化 了 我 们 的 讨论 ， 但 同时 这 也 使 我 们 面临 一 个 困境 。“Pascal 程 序 ” 是 良 
定义 的 ， 而 “ 易 懂 的 口头 描述 ” 却 不 是 ， 这 使 我 们 处 在 把 不 存在 算法 说 成 存在 的 危险 中 。 但 
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由 于 我 们 可 以 通过 它 保证 讨论 简单 、 清 晰 ， 能 够 对 相当 复杂 的 过 程 给 出 简洁 的 描述 ， 使 我 们 
的 冒险 得 到 一 定 的 补偿 。 如 果 读 者 怀疑 这 些 命题 的 正确 性 ， 可 以 通过 使 用 某 种 程序 设计 语言 
编写 一 个 合适 的 程序 来 进行 反 驱 。 


习题 


友 克 1. 考虑 一 个 计算 机 的 机 器 语言 集合 。 简 要 说 明 集 合 中 的 各 种 指令 是 如 何在 图 灵机 中 执行 的 。 
2. 在 上 面 的 讨论 中 ， 我 们 已 经 指出 图 灵机 比 下 推 自 动机 更 为 强大 。 由 于 图 灵机 的 带 能 够 像 栈 
一 样 地 工作 ， 从 这 似乎 可 以 看 出 ， 图 灵机 确实 比 下 推 自动 机 更 为 强大 。 指 出 在 上 述 论 据 中 ， 
哪 一 个 重要 的 因素 没有 考虑 ? 者 
友 克 3. 在 通俗 文献 中 有 很 多 有 意思 的 关于 图 灵机 的 论文 。 其 中 由 J. E. Hopcroft 于 1984 年 5 月 发 
表 在 《科学 美国 人 》( Scientific American) 上 的 ， 名 为 “图 灵机 ”的 论文 就 是 很 好 的 一 
篇 。 这 篇 论文 讨论 了 我 们 本 章 介绍 的 关于 图 灵机 的 思想 ， 并 且 给 出 了 一 些 图 灵 和 其 他 
人 工作 的 历史 背景 。 阅 读 这 篇 文章 ， 并 写 一 个 简要 的 评论 。 





第 10 章 图 灵机 的 其 他 模型 


我 们 在 上 一 章 中 给 出 的 标准 图 灵机 的 定义 并 不 是 唯一 可 行 的 ， 还 存在 着 若干 等 价 的 定义 。 
我 们 所 能 得 出 的 关于 图 灵机 能 力 的 结论 在 很 大 程度 上 独立 于 为 之 选 定 的 特定 结构 。 在 本 章 中 ， 
我 们 将 再 介绍 几 个 更 加 复杂 的 图 灵机 模型 ， 在 某 种 意义 上 它们 和 标准 图 灵机 的 能 力 是 等 价 的 。 

如 果 我 们 接受 图 灵 论 题 ， 则 我 们 可 以 认为 ， 通 过 赋予 标准 图 灵机 更 加 复杂 的 存储 设备 ， 
并 不 会 对 这 种 自动 机 的 能 力 有 任何 影响 。 任 何 能 被 这 种 新 型 图 灵机 执行 的 计算 ， 均 属于 机 械 
计算 (mechanical computation ) 的 范畴 ， 因 此 ， 也 能 够 通过 标准 图 灵机 来 完成 。 仅 仅 从 证 明 
我 们 所 预期 的 标准 图 灵机 的 能 力 从 而 增加 我 们 对 图 灵 论 题 的 信心 这 一 点 看 ， 研 究 更 加 复杂 的 
模型 也 是 有 益 的 。 定 义 9.1 中 所 介绍 的 基本 模型 的 许多 变种 都 是 可 行 的 ， 比 如 有 多 条 吾 的 图 灵 
机 或 者 多 维 带 的 图 灵机 。 本 章 我 们 将 考虑 在 后 续 讨 论 中 有 用 的 图 灵机 的 变种 。 

我 们 还 将 研究 非 确 定型 图 灵机 ， 并 证 明 它 们 和 确定 型 图 灵机 的 能 力 等 价 。 这 是 出 乎 我 们 
意料 之 外 的 ， 因 为 图 灵 论 题 仅 仅 覆盖 了 机 械 计算 的 内 容 ， 并 没有 讨论 在 非 确定 型 中 所 隐 含 的 
智能 猜测 。 图 灵 论 题 中 没有 直接 解决 的 另 一 个 问题 是 关于 同一 台 机 器 在 不 同 的 时 间 执 行 不 同 
的 程序 ， 这 导致 了 “可 再 编程 的 ”或 者 “通用 的 ”图 灵机 思想 的 出 现 。 

最 后 ， 我 们 还 将 介绍 线性 有 界 自动 机 (linear bounded automata ) ， 这 个 概念 将 在 后 续 章 节 
中 用 到 。 所 谓 线性 有 界 自动 机 ， 是 指 具 有 一 条 无 穷 带 (infinite tape)， 但 只 能 以 一 种 受 限 的 方 
式 使 用 这 条 带 的 一 类 图 灵机 。 


10.1 对 图 灵机 的 较 小 修改 


我 们 首先 考虑 对 定义 9.1 做 一 些 较 小 的 改动 ， 并 探讨 这 些 改 动 是否 导 致 了 一 般 概念 上 的 差 
异 。 每 次 我 们 改动 一 个 定义 都 会 引入 一 种 新 型 的 自动 机 ， 并 引起 如 下 问题 : 这 些 新 型 的 自动 
机 和 以 前 我 们 所 遇 到 的 自动 机 是 否 有 实质 上 的 区 别 ? 我 们 所 说 的 一 类 自动 机 和 另 一 类 自动 机 
之 间 的 “实质 上 的 区 别 ” 是 指 什么 呢 ? 虽然 它们 的 定义 之 间 可 能 有 着 明显 的 差异 ， 但 是 这 些 
差异 并 不 一 定 能 导致 令 我 们 感 兴趣 的 结果 。 我 们 可 以 在 前 面 章 节 中 介绍 的 确定 型 和 非 确定 型 
有 穷 自 动机 中 看 到 这 一 点 : 这 两 种 自动 机 的 定义 过 然 不 同 ， 但 在 它们 都 精确 对 应 于 正则 语言 
族 这 一 意义 上 ， 这 两 种 自动 机 是 等 价 的 。 依 此 推断 ， 我 们 可 以 在 一 般 意 义 上 定义 自动 机 类 
(classes of automata) 的 等 价 性 或 不 等 价 性 。 


10.1.1 自动 机 类 的 等 价 性 


当 我 们 定义 两 个 自动 机 或 者 自动 机 类 的 等 价 性 时 ， 我 们 必须 首先 明确 这 种 “等 价 性 ” 意 
味 着 什么 。 在 本 章 的 后 续 部 分 中 ， 我 们 将 遵循 为 确定 型 有 穷 接受 器 (dfa) 和 非 确定 型 有 穷 接 
受 器 (nfa) 所 建立 的 先例 ， 用 接受 语言 的 能 力 来 定义 “等 价 性 ”。 

定义 10.1 两 个 自动 机 是 等 价 的 , 如 果 它 们 能 接受 同样 的 语言 。 考 虑 两 个 自动 机 类 Cj 和 C,， 
如 果 对 于 Ci 中 的 任意 自动 机 M1， 都 存在 Cs 中 的 自动 机 M,， 满 足 


= 
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L(M') = L(M,) 


我 们 就 称 C, 具 有 至 少 和 C| 相 同 的 能 力 。 反 之 亦 成 立 ， 即 对 于 Cs 中 的 任意 自动 机 M，,， 部 存在 C) 
中 的 自动 机 M1， 满足 L(M1) = L(M;)， 我 们 就 称 C1 和 Cs 是 等 价 的 。 
有 多 种 方式 可 以 证 明 自 动机 的 等 价 性 。 定 理 2.2 中 的 构造 性 方法 被 用 于 证 明 dfa 和 nfa 的 等 
价 性 。 为 了 证 明 图 灵机 的 等 价 性 ， 我 们 经 常 采用 一 种 重要 的 称 作 模 拟 (simulation) 的 技术 。 
设 M 是 一 个 自动 机 ， 我 们 称 自动 机 应 可 以 模拟 M 的 一 个 计算 ， 如 果 应 可 以 按照 如 下 的 方 
式 模仿 M 的 计算 。 设 do, 由 ,… 是 M 计 算 的 瞬时 描述 序列 ， 即 
doF y diF yy da 
则 称 凑 模拟 这 个 计算 ， 如 果 应 可 以 执行 和 M 类 似 的 如 下 计算 : 
did vd 
其 中 4,,4,,… 是 瞬时 描述 ， 并 且 每 个 瞬时 描述 都 对 应 于 M 的 唯一 一 个 状态 。 换 句 话说 ， 如 果 我 
们 知道 说 执行 的 计算 以 及 初始 格局 ， 我 们 就 能 准确 地 确定 M 所 执行 的 计算 。 
应 该 注意 的 是 ，M 的 一 次 迁移 d; Fy d , ,在 应 的 模拟 中 可 能 对 应 于 若干 次 迁移 。 迁 移 4 
di , | 的 中 间 格 局 可 能 不 对 应 于 M 的 任何 格局 ， 但 如 果 我 们 能 确定 应 对 应 的 格局 ， 就 不 会 有 任何 
影响 。 只 要 我 们 能 从 褒 的 计算 确定 W 的 计算 ， 这 种 模拟 就 是 正确 的 。 如 果 应 能 够 模拟 MM 的 任 
何 计算 ， 则 我 们 称 应 能 够 模拟 M。 我 们 应 该 清楚 ， 如 果 应 能 够 模拟 M， 那 么 问题 就 转化 为 它 
们 能 够 接受 相同 的 语言 ， 于 是 它们 是 等 价 的 。 为 了 证 明 两 个 自动 机 类 的 等 价 性 ， 我 们 需要 证 
明 对 于 一 类 中 的 任何 一 个 自动 机 ， 在 另 一 类 中 都 存在 着 可 以 模拟 它 的 自动 机 。 


10.1.2 带 不 动 选 择 的 图 灵机 


在 标准 图 灵机 定义 中 ， 读 写 头 要 么 是 向 左 移动 要 么 是 向 右 移动 ， 而 有 时 为 了 方便 ， 我 们 
引入 第 三 种 选择 ， 即 在 读 写 头 重 写 带 上 单元 后 位 置 保 持 不 动 。 于 是 ， 我 们 可 以 修改 定义 9.1， 
得 到 新 的 带 不 动 选择 的 图 灵机 (Turing machine with stay-option) 的 定义 ， 办 法 是 将 定义 9.1 
中 的 6 替换 为 

6:0xT-—>OxTx{L,R,S)} 


5 表示 读 写 头 位 置 保持 不 动 。 这 一 改动 并 没有 增强 标准 图 灵机 的 能 力 。 
定理 10.1 带 不 动 选择 的 图 灵机 类 与 标准 图 灵机 类 等 价 。 

证 明 : 因为 带 不 动 选择 的 图 灵机 显然 是 标准 图 灵机 的 扩展 ， 于 是 任何 标准 图 灵机 无 疑 可 以 被 

带 不 动 选择 的 图 灵机 模拟 。 

为 了 证 明 逆 命题 〈 即 标准 图 灵机 可 以 模拟 带 不 动 选择 的 图 灵机 )， 我 们 令 M = (0, ,FT, 5， 
qo, 口 , ) 为 一 带 不 动 选择 的 图 灵机 ， 用 一 个 标准 图 灵机 在 = (@.Z,T,6. 人 口 ,六 模拟 它 。 对 于 
M 的 每 一 步 ， 模 拟 机 应 都 做 如 下 工作 : 如 果 W 的 读 写 头 向 左 移动 或 者 向 右 移动 ， 则 应 的 读 写 
头 也 相应 地 向 左 或 向 右 移动 ; 如 果 M 执 行 了 动作 8 ( 即 读 写 头 保持 不 动 )， 则 应 执行 两 步 动作 : 
读 写 头 首先 重 写 单元 格 并 向 右 移动 ， 然 后 对 新 移动 到 的 单元 格 不 做 任何 修改 并 向 左 移动 。 这 
一 模拟 机 可 以 通过 定义 8 由 M 构 造 如 下 : 

对 于 每 一 步 转移 
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(gq;, 9) = (g,, b, L or R) 
我 们 把 5 解释 为 
6(G,,a) = (6,,b,L or R) 
对 于 每 一 步 读 写 头 不 动 的 转移 
6(gi, a) = (gq,, b, 5) 


我 们 把 6 解释 为 相应 的 两 步 转移 
6(G,,4) = (G,b, R) 
和 
Ge- (@,c, 1) 
其 中 cET。 


很 明显 ， 对 1 的 每 一 个 计算 ， 都 有 对 应 的 故 的 一 个 计算 ， 因 此 丰 可 以 模拟 M。 国 

模拟 是 证 明 自 动机 等 价 的 一 种 标准 技术 。 我 们 在 上 一 个 定理 中 所 描述 的 形式 体系 使 得 准 
确 地 讨论 过 程 和 证 明 有 关 等 价 性 的 定理 成 为 可 能 。 在 后 续 讨 论 中 ， 我 们 会 频繁 地 使 用 模拟 的 
思想 ， 但 一 般 我 们 不 会 试图 严格 并 具体 地 描述 所 有 细节 。 图 灵机 的 完全 模拟 通常 是 很 繁琐 的 ， 
为 了 避免 这 一 点 ， 我 们 的 讨论 只 限于 描述 性 的 ， 而 非 定理 证 明 的 形式 。 虽然 对 于 模拟 我 们 只 
给 出 总 体 描述 ， 但 这 些 描述 同样 能 够 易于 转化 为 严格 的 证 明 。 读 者 将 会 发 现 用 高 级 语言 或 者 
伪 码 描述 每 个 模拟 是 有 益 的 。 

在 介绍 其 他 模型 之 前 ， 我 们 再 对 标准 图 灵机 做 一 点 评述 。 从 定义 9.1 可 以 看 出 ， 每 个 带 
符号 都 可 以 是 一 些 符号 的 组 合体 ， 而 不 仅仅 是 单个 符号 。 通 过 对 图 9-1 的 扩展 (图 10-1) 我 
们 可 以 更 清楚 地 认识 到 这 一 点 。 在 图 10-1 中 ， 每 一 个 带 符号 都 是 三 个 较 简单 的 字母 构成 的 三 


元 组 。 
a _ 第 1 道 
2 一 了 - 第 2 首 
c 第 3 道 


图 10-1 


在 图 10-1 中 ， 我 们 将 带 上 的 每 个 单元 划分 为 三 个 部 分 ， 每 部 分 都 称 为 道 (track )， 每 个 道 
包含 三 元 组 的 一 个 成 员 。 基 于 这 一 直观 认识 ， 这 样 的 图 灵机 有 时 被 称 为 多 道 图 灵机 (Turing 
machine with multiple tracks)。 但 这 一 观点 并 没有 扩展 定义 9.1， 因 为 我 们 所 要 做 的 只 是 将 T 改 
为 一 个 新 的 字母 表 ， 其 中 每 个 符号 包含 几 个 部 分 。 

然而 ， 其 他 图 灵机 模型 就 需要 对 定义 做 一 些 修 改 ， 因此 这 些 图 灵机 与 标准 图 灵机 的 等 价 
性 是 需要 证 明 的 。 我 们 来 看 两 个 这 样 的 模型 ， 这 两 个 模型 有 时 也 被 作为 图 灵机 的 标准 定义 。 
一 些 较 少见 的 图 灵机 变形 将 在 本 节 末 的 习题 中 提出 。 
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10.1.3 单 向 无 穷 带 图 灵机 

很 多 作者 并 不 把 图 9-1 中 的 模型 作为 标准 图 灵机 模型 ， 而 是 采用 单 向 无 穷 带 图 灵机 (Turing 
machine with semi-infinite tape )。 我们 可 以 把 这 一 图 灵机 直观 地 理解 为 带 只 有 左边 界 (图 10-2)。 
这 一 模型 与 我 们 的 标准 模型 同样 是 等 价 的 ， 区 别 只 在 于 当 读 写 头 位 于 带 的 左边 界 时 不 能 向 左 
移动 。 





1 
| | 


不 难看 到 ， 这 一 限制 并 没有 影响 图 灵机 的 能 力 。 为 了 用 单 向 无 穷 带 图 灵机 应 模拟 标准 图 
灵机 M ， 我 们 采用 图 10-3 所 示 的 带 。 


< 一 一 第 1 道 模拟 标准 带 的 右 部 
< 一 一 第 2 道 模拟 标准 带 的 左 部 


图 10-3 


模拟 机 AM 有 一 条 双 道 带 。 在 上 道中 ,我们 保存 位 于 M 带 上 某 一 参考 点 右 侧 单元 的 内 容 ， 
例如 可 以 选择 计算 开始 时 读 写 头 的 位 置 作为 参考 点 。 在 下 道中 ， 我 们 以 逆序 保存 位 于 M 带 上 
参考 点 左 侧 的 内 容 。 我 们 可 以 对 放 编 程 ， 使 得 当 M 的 读 写 头 位 于 参考 点 右 侧 时 ， 应 使 用 上 道 
的 信息 ; 当 M 的 读 写 头 位 于 参考 点 左 侧 时 ， 放 使 用 下 道 的 信息 。M 的 读 写 头 是 否 位 于 参考 点 
右 侧 可 以 通过 将 必 的 状态 分 为 两 部 分 以 辅助 进行 判断 ， 比 如 设 这 两 类 状态 分 别 为 Ou 和 Q,: 
当 工作 于 上 道 时 使 用 前 者 ， 当 奉 工 作 于 下 道 时 使 用 后 者 。 左 边界 处 的 上 下 道中 均 包 含 特殊 
的 结束 符 #， 以 便于 两 个 道 之 间 的 切换 。 例 如 ， 被 模拟 的 图 灵机 M 和 模拟 机 府 分 别处 于 图 10-4 
所 示 的 格局 ， 并 且 将 要 模拟 的 迁移 由 


0(g;, a) 一 (qj, C， L) 





生成 。 模 拟 机 应 先 通过 转移 
6(6,,(a,b)) = (@,,(c,b), DD) 


来 进行 了 迁移， 其 中 4; EQ, 。 因 为 刍 属 于 Qs， 所 以 此 处 只 考 虚 上 道 的 信息 。 此 时 ， 模 拟 机 在 状 
态 9; SQ 看 到 了 符号 (#,#)， 接 下 来 作 转移 


6(G,,(#,#)) = (P,,(#,#), R) 


其 中 记 EQ, ， 产 生 格局 如 图 10-5 所 示 。 现 在 模拟 机 的 状态 属于 Q, 并 将 工作 于 下 道 ， 由 此 我 们 
可 以 直接 得 到 此 模拟 过 程 的 更 详细 的 描述 。 
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六 4 
| 
Y 
6 a 
a) 被 模拟 的 图 灵机 b) 模拟 机 


图 10-4 


人 A 


广 出 广 


图 10-5 模拟 Cgqi, a) = (qj, c, 站 的 格局 序列 











10.1.4 离线 图 灵机 


第 1 章 中 自动 机 的 一 般 性 定义 中 包含 一 个 输入 文件 和 一 个 临时 存储 空间 。 在 定义 9.1 中 ， 为 
了 简单 起 见 ， 我 们 去 掉 了 输入 文件 ， 并 声明 这 样 做 并 不 会 改变 图 灵机 的 概念 。 我 们 现在 就 详 
细 地 讨论 这 一 点 。 

如 果 我 们 在 模型 中 加 入 输入 文件 ， 我 们 所 得 到 的 就 是 离线 图 灵机 (off-line Turing machine)。 
在 这 类 机 器 中 ， 每 一 步 转换 都 是 由 内 部 状态 、 从 输入 文件 当前 读 到 的 符号 以 及 读 写 头 所 见 到 的 
带 上 的 符号 控制 的 。 离 线 图 灵机 的 图 示 如 图 10-6 所 示 。 离 线 图 灵机 的 形式 化 定义 是 很 容易 给 出 的 ， 
但 我 们 把 这 留 作 一 个 习题 。 我 们 只 想 简 要 地 说 明 为 何 离线 图 灵机 类 与 标准 图 灵机 类 是 等 价 的 。 

首先 ， 任 何 标准 图 灵机 的 行为 都 可 由 离线 图 灵机 模拟 。 模 拟 机 所 要 做 的 只 是 将 输入 文件 
的 内 容 拷贝 到 带 上， 然后 便 能 以 与 标准 图 灵机 相同 的 方式 工作 。 





a|s|c ja 只 读 输 入 文件 





控制 单元 





图 10-6 
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对 标准 图 灵机 MM 如 何 模 拟 离线 图 灵机 M 的 描述 要 稍 长 一 些 。 标 准 图 灵机 可 以 通过 使 用 图 
10-7 所 示 的 四 道 带 模 拟 离 线 图 灵机 。 图 10-7 所 示 的 带 的 内 容 代 表 了 图 10-6 中 的 格局 。 必 的 四 
道中 的 每 一 道 在 模拟 中 都 有 特定 的 功能 :第 一 道 包 含 M 的 输入 ; 第 二 道 记 录 M 的 输入 文件 的 当 
前 输入 位 置 ， 第 三 道 代表 M 的 带 ; 第 四 道 记录 M 的 读 写 头 的 位 置 。 


好 的 控制 部 件 





图 10-7 


M 对 M 的 每 步 转移 的 模拟 都 需要 若干 步 。 从 某 个 标准 位 置 开始 ， 比 如 左边 界 ， 借 助 于 特 
殊 结 束 符 所 标记 的 相关 信息 ， 族 在 第 二 道 寻 找 MM 输 入 文件 的 输入 位 置 。 找 到 第 一 道上 的 相应 
单元 后 ， 必 将 此 信息 记录 在 我 们 为 此 目的 而 设置 的 控制 部 件 状态 中 。 接 下 来 ， 放 在 第 四 道上 
寻找 M 读 写 头 的 位 置 。 综 合 在 状态 中 记录 的 输入 信息 和 第 三 道上 的 符号 ， 我 们 就 知道 必要 做 的 
转移 了。 这 一 信息 再 次 被 记录 在 让 的 相应 内 部 状态 中 。 然 后 ， 详 将 对 其 所 有 4 条 道 进行 改写 ， 
以 反映 1 所 作 的 转移 。 最 后 ， 杂 的 读 写 头 返回 标准 位 置 以 进行 对 M 下 一 转移 的 模拟 。 
253 习题 
256 1 给 出 单 向 无 穷 带 图 灵机 的 形式 化 定义 。 并 证 明 单 向 无 穷 带 图 灵机 类 与 标准 图 灵机 类 等 价 。 
2. 给 出 离线 图 灵机 的 形式 化 定义 。 
3. 证 明 任何 能 够 被 离线 图 灵机 接受 的 语言 也 能 被 标准 图 灵机 接受 。 
4. 考虑 如 下 图 灵机 模型 ， 在 每 一 次 迁移 中 ， 图 灵机 可 以 改写 带 符号 ， 也 可 以 移动 读 写 头 ， 但 
不 能 二 者 都 做 。 
(a) 给 出 此 类 图 灵机 的 形式 化 定义 。 
(b) 证 明 这 种 图 灵机 类 与 标准 图 灵机 类 等 价 。 各 
5. 考虑 如 下 图 灵机 模型 ， 在 每 一 次 迁移 中 ， 读 写 头 可 以 向 左 或 向 右 移动 一 个 以 上 的 单元 , 移 
动 距 离 和 方向 作为 转移 函数 6 的 参数 。 给 出 此 类 图 灵机 的 准确 定义 ， 并 描述 如 何 用 标准 图 灵 
机 模拟 此 类 图 灵机 。 
6. 不 可 擦 除 图 灵机 (nonerasing Turing machine) 不 能 将 韭 空白 符 改写 为 空白 符 。 这 一 点 可 以 
通过 如 下 限制 实现 ， 如 果 


0q,a) = (9 口 ,LorR) 
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那么 a 一 定 是 门 。 证 明 这 类 图 灵机 与 标准 图 灵机 等 价 。 者 

7. 考虑 不 能 将 带 符号 改写 为 空白 符 的 图 灵机 ， 即 对 所 有 6(4,, a) = (qj, b, 工 or R)，5 一 定 属于 
=-{ 口 }。 证明 此 图 灵机 模型 能 够 模拟 标准 图 灵机 。 

8. 假设 我 们 要 求 图 灵机 只 能 在 终 态 停机 ， 即 对 于 所 有 (4, 9)，“ET 且 qEF，6(4, 0) 都 要 有 定 
义 。 这 一 要 求 是 否 限制 了 图 灵机 的 能 力 ? 

9. 假设 我 们 要 求 图 灵机 在 带 上 窟 的 符号 不 能 和 带 上 该 位 置 的 原来 符号 相同 ， 即 如 果 


gq;, a) = (g;, b, L or R) 
则 a 与 bp 必须 相 异 。 这 一 限制 是 否 降低 了 图 灵机 的 能 力 ? 区 
10. 考虑 图 灵机 的 如 下 变形 ， 转 换 不 仅 取决 于 读 写 头 当前 所 在 的 单元 符号 ， 还 取决 于 当前 单元 
左边 的 一 个 单元 符号 及 右边 的 一 个 单元 符号 。 给 出 此 类 图 灵机 的 形式 化 定义 ， 并 描述 如 何 
用 标准 图 灵机 模拟 此 类 图 灵机 。 
11. 考虑 下 类 图 灵机 ， 其 转移 的 决策 过 程 不 同 于 标准 图 灵机 ， 转 移 仅 在 当前 带 符号 不 属于 特定 
的 符号 集合 时 发 和 后。 例如 





6(qi, {a, b}) = (9 c, R) 
仅 在 当前 带 符 号 既 非 4 也 非 p 时 允许 迁移 发 生 。 给 出 这 一 概念 的 形式 化 描述 ， 并 证 明 此 类 图 
灵机 与 标准 图 灵机 模型 等 价 。 霹 
10.2 具有 更 复杂 存储 的 图 灵机 
标准 图 灵机 的 存储 装置 是 如 此 简单 ， 以 致 人 们 可 能 以 为 通过 将 存储 装置 复杂 化 有 可 能 增 
强 图 灵机 的 能 力 。 但 事实 并 非 如 此 ， 我 们 现在 用 两 个 例子 加 以 说 明 。 
10.2.1 多 带 图 灵机 


多 带 图 灵机 (multitape Turing machine) 是 一 个 有 多 条 带 的 图 灵机 ， 每 一 条 带 都 有 -一 个 被 
独立 控制 的 读 写 头 (图 10-8)。 




















ITT TD 
带 1 
图 10-8 


多 带 图 灵机 的 形式 化 定义 已 经 超出 了 定义 9.1 的 形式 ， 因 为 多 带 图 灵机 的 转移 函数 不 同 于 
标准 图 灵机 。 - 般 我 们 如 下 定义 n- 带 图 灵机 .: M 三 (2， >， I, 6, Go0， 口 ]， D)， 其 中 9， >， 工 ， go, F 的 


心 
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定义 与 定义 9.1 相 同 ， 不 同 的 是 6 

6:0xT" =»>OxT"x {L,RY 
它 定 义 了 发 生 在 所 有 带 上 的 转移 。 例 如 ， 若 n = 2， 当 前 格局 如 图 10-8 所 示 ， 则 

6(qo, a, e) 二 (qi, X， 了 了， L, R) 
的 解释 如 下 : 此 条 转移 规则 只 能 在 图 灵机 处 于 状态 4,， 第 一 个 读 写 头 当前 所 见 符号 为 4。， 第 二 
个 读 写 头 当前 所 见 符 号 为 e 时 应 用 ， 第 一 条 带 上 的 读 写 头 将 当前 单元 内 容 改 写 为 x 并 向 左 移 动 ， 
同时 第 二 条 带 上 的 读 写 头 将 当前 单元 内 容 改 写 为 y 并 向 右 移动 ， 然 后 控制 部 件 将 状态 改 为 gj， 
图 灵机 进入 下 一 个 格局 ， 如 图 10-9 所 示 。 





图 10-9 


为 了 证 明 多 带 图 灵机 与 标准 图 灵机 的 等 价 性 ， 我 们 只 和 需 证 明 任 何 给 定 多 带 图 灵机 MM 都 能 
被 标准 图 灵机 有 故 模 拟 ， 并 且 任 何 标准 图 灵机 也 都 能 被 多 带 图 灵机 模拟 。 后 者 是 显而易见 的 ， 
因为 我 们 总 是 可 以 让 一 个 多 带 图 灵机 只 在 其 一 条 带 上 做 有 用 的 工作 。 用 只 有 一 个 带 的 标准 图 
灵机 模拟 多 带 图 灵机 有 些 复 杂 ， 但 在 概念 上 仍 是 简单 的 。 

考虑 图 10-10 所 示 的 2- 带 图 灵机 。 模 拟 此 2- 带 图 灵机 的 单 带 图 灵机 的 带 有 4 个 道 (图 10-11 )。 
第 一 道 表示 M 的 第 一 条 带 ; 第 二 道 的 非 空 白 单元 除了 表示 M 的 第 一 条 带 读 写 头 当前 位 置 的 那个 
单元 是 1 外 ， 其 他 单元 都 是 0; 类 似 地 ， 第 三 道 和 第 四 道 用 来 模拟 M 的 第 二 条 带 。 通 过 图 10-11， 
我 们 可 以 清楚 地 看 到 ， 对 于 说 的 每 一 个 相关 的 格局 (具有 图 10-11 所 示 形 式 的 格局 ) ，M 都 有 
了 瞧 一 一 个 格局 与 之 对 应 。 





图 10-10 
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图 10-11 


多 带 图 灵机 用 单 带 图 灵机 表示 ， 类 似 于 离线 图 灵机 用 标准 图 灵机 表示 。 实 际 的 模拟 步骤 
也 非常 相似 ， 唯 一 的 区 别 就 是 模拟 多 带 图 灵机 时 需要 考虑 多 条 带 。 我 们 可 以 沿用 与 离线 图 灵 
机 的 标准 图 灵机 表示 大 体 相 似 的 结构 ， 同 时 做 一 些小 的 改动 。 在 沿用 的 同时 ， 我 们 已 经 可 以 
清楚 地 知道 如 何 修改 M 的 转移 函数 6 从 而 获得 履 的 转移 函数 5 了 。 虽 然 给 出 详细 的 描述 并 不 困 
难 ， 但 很 繁琐 。 当 然 ， 繁 琐 并 不 影响 结论 的 正确 性 ， 即 M 能 做 的 事情 契 也 能 做 。 

需要 注意 的 一 点 是 ， 当 我 们 说 多 带 图 灵机 并 不 比 标准 图 灵机 功能 更 强大 时 ， 我 们 只 是 指 
它们 所 能 做 的 工作 相同 ， 即 能 接受 相同 的 语言 。 

例 10.1 考虑 语言 {ao}。 在 例 9.7 中 ， 我 们 构造 了 一 个 单 带 图 灵机 来 接受 这 个 语言 ， 但 方 
法 繁琐 。 而 用 一 个 2- 带 图 灵机 就 会 使 工作 大 为 简化 。 假 设 在 计算 的 初始 状态 ， 第 一 条 带 上 的 
初始 符号 串 为 a"b"。 然 后 ， 我 们 把 所 有 a 拷贝 到 第 二 条 带 上 。 当 我 们 拷贝 完 最 后 一 个 4 时， 我 
们 开始 将 第 条 带 上 的 5 与 第 二 条 带 上 的 a 进行 匹配 。 这 样 我 们 就 可 以 判断 a 的 个 数 和 4b 的 个 数 
是 否 相 等 ， 同 时 无 须 读 写 头 反复 地 来 回 移动 。 口 

我 们 应 记 住 ， 图 灵机 的 各 种 变形 被 认为 是 等 价 的 ， 只 是 从 能 做 什么 事情 这 一 意义 上 考虑 ， 
而 不 是 从 是 否 容易 编程 或 我 们 可 能 关心 的 其 他 效率 度量 方面 考虑 。 在 第 14 章 我 们 还 会 考虑 这 
个 重点 。 


10.2.2 多 维 图 灵机 


多 维 图 灵机 (multidimensional Turing machine ) 是 一 种 其 带 在 多 个 维度 上 都 可 以 无 限 扩 
展 的 图 灵机 ， 图 10-12 所 示 为 一 个 二 维 图 灵机 的 图 。 


二 维 坐标 地 址 图 
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在 二 维 图 灵机 的 形式 化 定义 中 ， 转 移 图 数 6 具 有 下 面 的 形式 
6:0xT—>OxTx{L,R,U,D}) 


其 中 U 和 DPD 分别 表 示 读 写 头 向 上 移动 和 向 下 移动 。 

为 了 用 标准 图 灵机 模拟 二 维 图 灵机 ， 我 们 可 以 采用 图 10-13 所 示 的 2- 道 模型 。 首 先 ， 我 们 
给 二 维 图 灵机 的 二 维 带 的 每 个 单元 一 个 地 址 。 这 可 以 有 很 多 种 方法 ， 例 如 图 10-12 所 示 二 维 坐 
标 表示 法 。 模 拟 机 的 两 道 之 一 用 于 记录 单元 内 容 ， 另 一 道 用 于 保存 相应 单元 的 地 址 〈 称 这 个 
道 为 地 址 道 )。 假 设 在 图 10-12 所 示 的 格局 中 ， 单 元 (1，2) 内 容 为 4， 单 元 (10，-3) 内 容 
为 2， 则 相应 的 模拟 机 的 格局 如 图 10-13 所 示 。 注 意 一 点 : 单元 地 址 可 以 是 无 限 大 的 整数 ， 所 
以 地 址 道 不 能 用 固定 区 域 来 存储 地 址 ， 而 应 采用 可 变 区 域 来 存储 ， 并 用 特殊 符号 分 隔 区 域 边 
界 ， 如 图 10-13 所 示 。 





[| | TT ToT TT Tr fr | 
| 1 #2 #1101#*1- |3]|#)] 


图 10-13 


我 们 假设 在 每 个 迁移 模拟 的 开始 ， 二 维 图 灵机 MM 的 读 写 头 与 模拟 机 放 的 读 写 头 总 是 分 别 
位 于 相应 的 两 个 单元 上 。 要 模拟 M 的 一 步 迁移 ， 模 拟 机 让 首先 计算 M 的 读 写 头 将 要 移 到 的 单 
元 地 址 。 采 用 二 维 坐标 地 址 图 ， 这 一 计算 是 非常 简单 的 。 当 地 址 计算 出 来 后 ， 应 就 在 第 二 道 
上 找到 这 一 地 址 ， 然 后 按照 4 的 迁移 修改 单元 内 容 。 此 外 ， 如 果 给 定 M， 则 构造 应 的 过 程 是 
相当 简单 的 。 


习题 


我 们 对 图 灵机 讨论 的 目的 主要 是 想 通 过 证 明 标 准 图 灵机 能 够 模拟 更 复杂 的 图 灵机 来 增加 

图 灵 论 题 的 可 信和 度 。 不 幸 的 是 ， 具 体 的 模拟 总 是 很 繁琐 无 趣 。 在 下 面 的 练习 中 ， 读 者 只 需 大 

致 描述 模拟 过 程 即 可 ， 但 要 是 够 清楚 以 便 能 够 从 中 看 出 如 何 构造 具体 的 模拟 。 

1. 多头 图 灵机 (multihead Turing machine) 可 以 看 成 是 一 个 有 单一 带 、 单一 控制 部 件 和 多 个 

独立 读 写 头 的 图 灵机 。 给 出 多 头 图 灵机 的 形式 化 定义 ， 并 描述 如 何 用 标准 图 灵机 模拟 此 类 

.给 出 多 头 -多 带 图 灵机 的 形式 化 定义 。 并 描述 如 何 用 标准 图 灵机 模拟 此 类 图 灵机 。 

.给 出 单 带 多 控制 部 件 图 灵机 的 形式 化 定义 ， 其 中 每 个 控制 部 件 都 有 一 个 自 己 的 读 写 头 。 并 

说 明 如 何 用 多 带 图 灵机 模拟 此 类 图 灵机 。 

让 4. 队列 自动 机 (queue automaton) 的 临时 存储 部 分 是 一 个 队列 。 假 设 这 个 自动 机 是 一 个 在 
线 自动 机 ， 即 它 没有 输入 文件 ， 而 是 在 计算 开始 之 前 将 要 处 理 的 符号 串 置 于 队列 中 。 给 
出 此 类 自动 机 的 形式 化 定义 ， 并 将 其 能 力 与 图 灵机 进行 比较 。 杜 

友 5. 证 明 任何 一 个 图 灵机 都 可 以 被 一 个 不 超过 坟 个 状态 的 标准 图 灵机 模拟 ， 

6. 尽 你 的 所 能 将 习题 5 中 所 需 的 状态 数目 减少 (提示 : 最 少 的 可 能 数目 是 3)。 

真 7. 计数 器 (counter) 是 一 个 字母 表 只 含 两 个 符号 的 栈 ， 一 个 栈 开 始 符 (stack start symbol) 
和 一 个 计数 符 (counter symbol)。 只 有 计数 符 能 够 入 栈 或 出 栈 。 计 数 器 自动 机 (counter 
automaton ) 是 一 个 以 一 个 或 多 个 计数 器 作为 存储 部 件 的 确定 型 自动 机 。 证 明 任意 一 个 图 





ww 
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灵机 都 能 被 一 个 有 4 个 栈 的 计数 器 自动 机 模拟 。 

8, 证 明 任 何 一 个 可 以 由 标准 图 灵机 完成 的 计算 也 能 被 一 个 带 不 动 选择 的 、 拥 有 至 多 两 个 状态 
的 多 带 图 灵机 完成 。 志 

9. 给 出 完成 例 10.1 中 计算 的 详细 程序 。 


10.3 非 确定 型 图 灵机 


虽然 根据 图 灵 论 题 似乎 可 以 得 出 特定 的 带 结构 并 不 会 影响 图 灵机 能 力 的 结论 ， 但 这 一 结 
论 对 于 非 确定 型 图 灵机 来 说 则 是 不 成 立 的 。 因 为 非 确定 型 引入 了 选择 ， 从 而 具有 某 种 非 机 械 
化 的 特性 ， 此 时 就 不 能 再 用 图 灵 论 题 了 。 为 了 证 明 非 确定 型 图 灵机 与 标准 图 灵机 能 力 相同 ， 
我 们 需要 更 仔细 地 考察 非 确定 性 带 来 的 影响 。 我 们 再 次 用 模拟 技术 证 明 非 确定 性 行为 可 以 通 
过 确定 的 方式 加 以 处 理 。 
定义 10.2 非 确定 型 图 灵机 类 似 于 定义 9.1 中 的 图 灵机 ， 只 是 转移 函数 6 变 为 
6: QxT—>20"T" tN 


只 要 含有 非 确定 性 ，5 的 值 域 就 是 一 个 由 可 能 发 生 的 转移 构成 的 集合 。 对 每 一 步 转移 ， 图 灵机 
都 可 以 从 集合 中 任意 选择 一 个 。 
例 10.2 如 果 一 个 图 灵机 有 如 下 的 转移 函数 
6 (go, a) 三 {(qi, b, R), (92， C， L)} 
那么 这 个 图 灵机 就 是 非 确定 型 的 。 迁 移 
qodaa}- bgiaa 


和 


qoaaat- gq,L lcaa 


都 是 可 行 的 。 口 
因为 非 确定 性 在 计算 函数 中 的 作用 并 不 明显 ， 所 以 我 们 通常 将 非 确定 型 自动 机 看 作 符 号 
串 的 接受 器 。 非 确定 型 图 灵机 接受 符号 种 w， 如 果 存 在 某 个 可 行 的 迁移 序列 满足 


Gow 上 上 X19FX2 


其 中 4q/EF。 一 个 非 确定 型 自动 机 可 能 会 在 一 系列 迁移 后 进入 非 终 态 ， 也 可 能 其 所 作 的 一 系列 
转换 是 循环 的 从 而 没有 结束 的 时 候 ， 但 我 们 对 诸如 此 类 的 转换 序列 并 不 感 兴 趣 ， 我 们 感 兴趣 
的 是 是 否 存 在 一 个 导致 接受 的 迁移 序列 。 

为 了 证 明 非 确定 型 图 灵机 与 确定 型 图 灵机 的 能 力 相同 ， 我 们 需要 给 出 非 确 定 过 程 的 确定 
型 等 价 形式 。 其 实 我 们 已 经 间接 提供 了 一 种 等 价 形式 。 非 确定 性 可 以 被 看 作 确 定型 的 回潮 算 
法 。 确 定型 图 灵机 只 要 能 记录 回溯 过 程 中 的 状态 ， 就 可 以 模拟 非 确定 型 图 灵机 。 其 实 这 很 简 
单 ， 为 了 理解 这 一 点 ， 让 我 们 换 一 个 角度 看 非 确定 性 ， 这 种 观点 在 很 多 证 明 中 都 是 有 用 的 : 
一 个 非 确定 型 图 灵机 可 以 被 看 作 是 一 个 在 任何 必要 的 时 候 都 能 复制 自身 的 图 灵机 。 当 有 多 于 
一 种 迁移 可 供 选择 时 ， 这 种 图 灵机 就 会 把 自身 复制 成 多 个 图 灵机 ， 然 后 让 每 个 图 灵机 去 执行 
一 种 可 能 的 迁移 。 
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从 这 一 角度 看 非 确定 性 ， 它 便 显 得 尤为 非 机 械 化 。 当 然 ， 当 代 计 算 机 并 不 有 具备 无 限 复制 
自身 的 能 力 。 然 而 ， 确 定型 图 灵机 是 能 够 模拟 这 一 过 程 的 。 考虑 一 个 具有 二 维 带 的 图 灵机 
(图 10-14)。 每 两 个 横向 的 道 代表 一 个 图 灵机 。 上 道 代 表 带 ， 下 道 表 示 内 部 状态 和 读 写 头 位 置 。 
每 当 要 复制 出 一 个 新 的 图 灵机 的 时 候 ， 就 会 在 两 个 新 的 道上 写 人 相应 的 信息 。 图 10-15 表 示 了 
例 10.2 中 图 灵机 的 初始 格局 以 及 后 继 格 局 。 模 拟 机 寻找 所 有 活跃 的 道 (由 于 这 些 道 被 特殊 符 
号 所 包围 ， 所 以 总 能 被 找到 )， 执 行 指定 的 迁移 ， 如 果 有 必要 再 复制 自身 。 至 此 我 们 已 经 给 出 
了 模拟 的 大 致 过程 ， 我 们 已 经 可 以 认识 到 这 种 模拟 的 正确 性 了 ， 至 于 具体 细节 就 留 给 读者 自 
己 完成 。 


二 带 内 容 

本 六 人 内 部 状态 和 读 写 头 位 置 
带 内 容 
砚 机 2 

辕 双 机 内 部 状态 和 读 写 头 位 置 





图 10-15 一 个 非 确定 型 迁移 的 模拟 


基于 上 述 模拟 ， 我 们 可 以 得 出 结论 : 对 于 任何 一 个 非 确定 型 图 灵机 ， 都 存在 一 个 等 价 的 
确定 型 图 灵机 。 由 于 这 一 结论 非常 重要 ， 我 们 将 其 表述 为 定理 。 

定理 10.2 确定 型 图 灵机 类 和 非 确定 型 图 灵机 类 是 等 价 的 。 
证 明 : 对 于 一 个 非 确定 型 图 灵机 ， 用 前 面 讲 过 的 方法 构造 一 个 确定 型 图 灵机 ， 证 明 后 者 可 以 
模拟 前 者 。 瞩 


习题 


1. 详细 说 明 如 何 用 确定 型 图 灵机 模拟 非 确定 型 图 灵机 。 说 明 图 灵机 如 何 复制 自身 ， 如 何 找到 
当前 活跃 的 图 灵机 ， 以 及 如 何 将 已 经 停机 的 图 灵机 排除 在 后 续 考 虑 之 外 。 

2. 说 明 如 何 用 一 个 确定 型 图 灵机 模拟 一 台 二 维 非 确定 型 图 灵机 。 

3. 为 一 个 非 确定 型 图 灵机 编写 程序 ， 使 它 接受 如 下 语言 


L= {ww : wEt{a, b}'} 


把 它 与 确定 型 解决 方法 进行 比较 。 大 
4. 概要 说 明 如 何 编 写 一 个 非 确定 型 图 灵机 程序 ， 使 得 此 图 灵机 接受 语言 


L= {wwiw : weEtf{a, b}:} 


5. 为 接受 下 述 语言 的 非 确 定型 图 灵机 编写 一 个 简单 的 程序 
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L= {xwwey :x,y, wEf{a, b}', |x| 2 |y|} 


如 何 确定 性 地 解决 这 个 问题 
6. 设计 一 个 非 确定 型 图 灵机 ， 使 其 接受 语言 


工 = {o" : 7 不 是 质数 } 者 
让 7. 双 栈 自动 机 (two-stack automaton) 是 一 个 具有 两 个 独立 的 栈 的 非 确定 型 下 推 自动 机 。 为 
了 定义 这 样 的 自动 机 ， 我 们 对 定义 7.1 进 行 修改 ， 使 得 
6: Ox (ZU{A}) x Tx I 一 有 限 子 集合 CG xT x 


一 个 迁移 依赖 这 两 个 栈 的 栈 顶 值 ， 迁 移 的 结果 把 两 个 新 值 压 人 到 这 两 个 栈 中 。 证 明 双 栈 
自动 机 类 与 图 灵机 类 等 价 。 者 


10.4 通用 图 灵机 


让 我 们 来 看 下 面 这 段 与 图 灵 论 题 相 悖 的 论断 : “一 个 如 定义 9.1 所 描述 的 图 灵机 是 一 台 服 务 
于 特殊 目的 的 计算 机 。 一 旦 6 确定 了 ， 这 台 机 器 就 被 限制 于 执行 菜 种 特定 的 计算 。 而 数字 计算 
机 却 是 通用 计算 机 ， 人 们 可 以 对 它们 编程 ， 使 其 在 不 同 的 时 间 做 不 同 的 工作 。 因 此 ， 图 灵机 
与 通用 数字 计算 机 是 不 等 价 的 。” 

我 们 可 以 通过 设计 一 台 可 重 编程 的 图 灵机 (reprogrammable Turing machine) 来 解决 上 
述 问 题 ， 我 们 把 这 类 图 灵机 叫做 通用 图 灵机 (universal Turing machine )。 通 用 图 灵机 M, 是 这 
样 一 台 自 动机 ， 它 以 任意 一 台 图 灵机 M 的 描述 和 符号 串 w 作 为 输入 ， 并 可 以 模拟 M 在 w 上 的 计 
算 。 为 了 建造 这 样 一 个 M,， 我 们 首先 选择 一 种 图 灵机 的 标准 描述 方式 。 我 们 可 以 不 失 一 般 性 
地 假设 

Q = {q1, q2,*…, gn} 

其 中 4 是 初 态 ，4; 是 唯一 的 终 态 。 假 设 


T= {a, 2, ,am} 


其 中 a 表示 空格 符 。 然 后 我 们 选择 一 种 编码 方式 使 得 g, 被 编码 为 1，4, 被 编码 为 11 ， 依 此 类 推 。 
类 似 地 ，al 被 编码 为 1，a, 被 编码 为 11 ， 依 此 类 推 。 符号 0 作为 1 串 ( 仅 由 1 构成 的 串 ) 之 闻 的 分 
隔 符 。 有 了 如 上 对 初 态 、 终 态 以 及 空格 符 的 定义 ,我 们 就 可 以 用 6 完全 描述 任何 一 个 图 灵机 了 。 
我 们 用 上 述 编 码 方式 对 转移 函数 进行 编码 ， 转移 函数 的 参数 和 结果 的 顺序 是 事先 确定 的 。 例 
如 ，6(q1, 92) = (qs, a3, 卫 ) 被 编码 为 


“…10110110111010.… 


于 是 任何 一 个 图 灵机 都 可 以 被 编码 为 一 个 有 限 的 {0, 1}#* 上 的 符号 串 ， 并 且 对 任 给 的 一 个 图 灵 
机 的 编码 ， 我 们 都 可 以 按 唯一 的 方式 解码 。 有 一 些 符号 串 不 代表 任何 图 灵机 (比如 00011 )， 
但 我 们 可 以 轻易 地 识别 出 这 类 符号 串 ， 所 以 可 以 不 考虑 它们 。 

一 个 通用 图 灵机 M, 包 括 一 个 {0, 1} 上 的 字母 表 和 一 个 多 带 图 灵机 结构 ， 如 图 10-16 所 示 。 
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MM, 的 控制 部 件 


M 的 描述 工 LTTL M 的 内 部 状态 
M 的 带 内 容 
图 10-16 


对 于 任意 给 定 的 输入 M 和 w，1 带 用 于 记录 MM 的 定义 编码 ，2 带 记录 M 的 带 内 容 ，3 带 记录 M 
的 内 部 状态 。M, 首 先 查 看 2 带 和 3 带 的 内 容 以 决定 M 的 当前 格局 ， 然 后 查看 1 带 以 决定 MM 在 此 格 
局 下 的 动作 ， 最 后 ， 修 改 2 带 和 3 带 以 反映 此 次 迁移 的 结果 。 

有 理由 建造 一 台 实 际 的 通用 图 灵机 (例如 Denning、Dennis 和 Qualitz 1978)， 但 这 一 建造 
过 程 并 无 乐趣 。 相 比 之 下 我 们 更 喜欢 使 用 图 灵 假 设 。 显 然 我 们 可 以 用 某 种 程序 设计 语言 实现 
这 一 点 ; 实际 上 ，9.1 节 中 的 习题 1 提出 的 那个 程序 就 是 一 台 通 用 图 灵机 在 较 高 级 的 语言 上 的 
实现 。 因 此 ， 我 们 完全 可 以 期 望 用 一 台 标 准 图 灵机 完成 上 述 工作 。 于 是 ， 我 们 可 以 断言 下 述 
图 灵机 的 存在 : 对 于 任意 给 定 的 一 个 程序 ， 它 都 可 以 完成 此 程序 规定 的 计算 。 这 种 图 灵机 就 
是 通用 计算 机 的 模型 。 

每 一 个 图 灵机 都 可 以 由 0 和 1 的 符号 串 表 示 这 一 点 对 我 们 有 重要 的 启示 。 但 在 我 们 探讨 这 

些 启示 之 前 ， 我 们 需要 先 回顾 一 下 集合 论 的 一 些 结果 。 

某 些 集合 是 有 限 的 ， 但 大 多 数 有 趣 的 集合 (和 语言 ) 是 无 限 的 。 对 于 无 限 集合 ， 我 们 将 
其 划分 为 可 数 (countable) 集 和 不 可 数 (uncountable) 集 两 类 。 如 果 一 个 集合 的 元 素 可 以 一 
一 映射 到 正 整数 集 ， 就 称 这 个 集合 可 数 。 这 也 就 是 说 我 们 可 以 按照 某 种 顺序 写 出 这 个 集合 的 
元 素 ， 如 x!,、x,、x; 等 等 ， 于 是 此 集合 的 每 个 元 素 都 有 一 个 有 限 的 序号 。 例 如 ， 我 们 可 以 按照 
0，2,，4,… 的 顺序 写 出 所 有 偶数 。 因 为 每 一 个 正 整数 2n 都 出 现在 第 x + 1 个 位 置 上 ， 所 以 偶数 
集 是 可 数 的 。 这 一 点 并 不 会 令 人 感到 意外 ， 但 有 一 些 更 复杂 的 例子 却 是 有 悖 直觉 的 。 例 如 所 
有 形 如 P/4 的 分 数 构成 的 集合 ， 其 中 p 和 9 是 正 整 数 。 怎 样 排列 这 一 集合 中 的 元 素 才 能 证 明 此 集 
合 是 可 数 的 呢 ? 我 们 不 能 写成 


一 4 一 
上 1 一 


1 
"3 
因为 2/3 永 远 不 会 出 现 。 但 这 并 不 意味 着 此 集合 是 不 可 数 的 。 对 于 这 个 例子 ， 有 一 种 聪明 的 排 
列 集合 元 素 的 方法 能 够 证 明 此 集合 实际 上 是 可 数 的 。 如 图 10-17 所 示 的 方法 ， 我 们 可 以 按照 箭 
头 所 指 的 顺序 写 下 集合 元 素 。 那 就 是 


bi 


i 
| 


LIL 


iD | 一 
UL | 一 


在 这 个 序列 中 ，2/3 出 现在 第 八 个 位 置 上 ， 并 且 每 一 个 元 素 在 序列 中 都 有 相应 位 置 。 因 此 这 个 
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集合 是 可 数 的 。 
1 >» 
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AAA 
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图 10-17 


从 这 个 例子 可 以 看 出 ， 如 果 我 们 能 按 某 种 方法 顺序 地 写 出 集合 中 的 元 素 ， 我 们 就 能 够 证 
明 此 集合 是 可 数 的 。 我 们 将 这 类 方法 称 作 枚 举 过 程 (enumeration procedure )。 因 为 一 个 枚 举 
过 程 是 某 种 机 械 的 过 程 ， 所 以 我 们 可 以 用 图 灵机 模型 来 形式 化 地 定义 它 。 
定义 10.3 ” 令 3 为 字母 表 袜 上 的 符号 串 集 合 。 则 8 的 枚 举 过 程 就 是 一 个 执行 下 列 计算 步骤 的 
图 灵机 
qo gx # SIF qx # 82 


其 中 xiET 一 {#}, s;ES。 用 这 种 方式 ，5S 中 的 每 一 个 符号 囊 s 都 会 在 有 限 步 内 被 产生 。 状 态 g, 用 
于 表示 5S 的 成 员 状 态 。 也 就 是 说 每 当 机 器 进入 状态 9, 时 ，# 后 面 的 符号 囊 一 定 是 S 中 的 成 页 。 

并 非 每 个 集合 都 是 可 数 的 ， 我 们 在 下 一 章 会 看 到 一 些 不 可 数 的 集合 。 但 任何 一 个 可 以 被 
枚 举 的 集合 都 是 可 数 的 ， 因 为 枚 举 给 出 了 集合 中 所 有 元 素 之 间 的 顺序 。 

严格 地 讲 ， 一 个 枚 举 过 程 并 不 能 被 称 为 算法 ， 因 为 当 5 是 无 穷 集合 时 ， 枚 举 过 程 是 不 终止 
的 。 但 枚 举 过 程 依然 是 有 意义 的 ， 因 为 枚 举 的 结果 是 定义 清楚 且 可 预测 的 。 

例 10.3 令 Z = {a, b,c}。 如 果 我 们 能 找到 按 某 种 顺序 (比如 字典 序 ) 枚 举 出 集合 5 = >* 
中 所 有 元 素 的 枚 举 过 程 ， 那 么 8 就 是 可 数 的 。 但 是 字典 序 是 不 可 取 的 ， 除 非 我 们 对 它 作 一 些 修 
改 。 在 字典 中 ， 所 有 以 a 开头 的 单词 都 出 现在 以 b 开 头 的 单词 之 前 。 但 是 ， 当 有 无 穷 多 个 以 a 开 
头 的 单词 时 ,我们 就 永远 无 法 枚 举 出 以 b 开 头 的 单词 。 这 违反 了 定义 10.3 中 规定 的 任何 元 素 都 
必须 在 有 限 步 内 枚 举 出 的 条 件 。 

然而 ， 我 们 可 以 采用 修改 后 的 字典 序 ， 即 把 符号 串 的 长 度 作为 考虑 的 首要 因素 ， 其 次 是 
相同 长 度 符号 串 在 字典 中 出 现 的 顺序 。 下 面 就 是 8 的 一 个 枚 举 过 程 


a, b,c,aa, ab, ac ba, bb, bce, ca, cb, ce, aaa, 


由 于 我 们 在 后 面 还 会 用 到 这 一 顺序 的 定义 ， 所 以 我 们 将 它 称 为 良 序 (proper order)。 口 
上 述 讨论 的 一 个 重要 结论 就 是 图 灵机 是 可 数 的 。 
定理 10.3 所 有 图 灵机 构成 的 无 穷 集 合 是 可 数 的 。 
证 明 : 我 们 可 以 用 0 和 1 对 每 个 图 灵机 进行 编码 。 利 用 这 样 的 编码 ， 我 们 就 可 以 构造 出 如 下 的 
枚 举 过 程 : 
1. 按 良 序 生 成 {0, 1 六 中 的 下 一 个 符号 串 。 
2. 检查 生成 的 符号 串 ， 看 它 是 否定 义 了 一 个 图 灵机 。 如 果 是 ， 则 将 此 符号 串 按照 定义 
10.3 所 要 求 的 形式 写 在 带 上 ; 如 果 否 ， 则 忽略 此 符号 串 。 
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3. 转 到 第 1 步 。 
因为 每 一 个 图 灵机 都 有 一 个 有 限 的 描述 ， 所 以 任何 一 个 具体 的 图 灵机 最 终 都 能 够 被 这 一 


过 程 枚 举 出 来 。 图 


图 灵机 集合 元 素 之 间 的 具体 顺序 取决 于 我 们 所 用 的 编码 方式 。 如 果 采 用 另外 一 种 编码 
方式 ， 我 们 就 能 获得 另 一 种 顺序 。 然 而 ， 采 用 何 种 顺序 是 不 重要 的 ， 重 要 的 是 必须 存在 某 
种 顺序 。 


习题 


1. 大 致 给 出 一 个 算法 ， 检 查 一 个 {0, 1} 中 的 符号 串 是 否 是 一 个 图 灵机 的 编码 。 
2. 用 我 们 前 面 讲 过 的 编码 方式 ， 给 具有 如 下 转移 函数 的 图 灵机 编码 


0(9，， 01D) 三 (qi, Adl, R) 
0(9g a2) = (qs, 41, L) 
(gq, al = (g;, a,, L) 


3. 大 致 给 出 一 个 图 灵机 程序 ， 使 其 按 良 序 枚 举 出 集合 {0,1}* 中 的 元 素 。 村 
4. 在 习题 3 中 ，0 位 于 枚 举 序列 中 的 第 几 个? 
5. 设计 一 台 图 灵机 按 良 序 枚 举 出 集合 

L={ab":n21} 


6. 对 于 例 10.3， 找 到 一 个 函数 fw)， 该 函数 能 给 出 符号 囊 每 一 个 w 在 良 序 枚 举 序列 中 的 序号 。 
7. 证 明 由 所 有 形 如 (i,j.k) 的 正 整 数 三 元 组 构成 的 集合 是 可 数 的 。 

8. 设 S, 和 5, 是 可 数 集 。 证 明 S,US, 和 S, x 5, 也 是 可 数 集 。 Ed 

9. 证 明 有 限 个 可 数 集 的 第 卡 儿 积 也 是 可 数 的。 


10.5 线性 有 界 自动 机 


虽然 我 们 不 能 通过 使 图 灵机 的 带 结构 复杂 化 而 使 其 功能 变 强 ， 但 我 们 可 以 通过 限制 对 带 
的 使 用 方式 而 限制 图 灵机 的 能 力 。 我 们 在 前 面 已 经 见 过 一 个 例子 一 一 下 推 自动 机 。 我 们 可 以 
将 下 推 自 动机 看 作 是 有 -一 条 带 的 非 确定 型 图 灵机 ， 而 且 这 条 带 必须 以 栈 的 方式 使 用 。 我 们 还 
可 以 用 其 他 方式 限制 对 带 的 使 用 。 比 如 可 以 将 带 上 的 工作 空间 限制 在 一 个 有 限 的 范围 内 。 可 
以 证 明 ， 加 上 这 种 限制 的 图 灵机 就 是 有 限 状 态 自动 机 ( 见 本 节 习 题 3 ) ， 因 此 我 们 不 讨论 此 种 
限制 。 但 还 有 一 种 我 们 感 兴趣 的 限制 : 我 们 要 求 图 灵机 只 能 工作 于 带 的 输入 部 分 。 因 此 ， 较 
长 的 输入 符号 串 意 味 着 较 多 的 工作 空间 。 这 一 限制 定义 了 另 一 种 自动 机 : 线性 有 界 自动 机 
(linear bounded automata, lba ) 。 

像 标准 图 灵机 一 样 ， 线 性 有 界 自 动机 也 有 一 条 无 限 长 的 带 ， 但 带 上 能 够 使 用 的 部 分 的 长 
度 是 输入 部 分 的 函数 。 一 种 特殊 情况 就 是 ， 我 们 将 带 的 可 用 部 分 正好 限制 在 输入 部 分 所 占用 
的 单元 上 。 为 了 做 到 这 一 点 ， 我 们 可 以 将 输入 部 分 包含 在 两 个 特殊 符号 一 — 左 端 标记 (left- 
end marker) ([) 和 右 阅 标 记 (right-end marker) (]) 一 一 之 间 。 对 于 一 个 输入 w， 图 灵机 的 
初始 格局 由 瞬时 描述 gofw] 给 出 。 两 个 端点 标记 “[” 和 “]” 所 在 的 单元 不 能 被 重 写 ， 读 写 头 
也 不 能 移动 到 “[” 的 左边 或 “]” 的 右边 。 有 时 我 们 称 读 写 头 被 端点 标记 “ 弹 回 ”。 
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定义 10.4 一 个 线性 有 界 自动 机 是 一 个 非 确定 型 图 灵机 M = (QO,,T, 6, qo, 口 , F)， 具 有 如 
定义 10.2 所 述 的 限制 ， 并 且 字 母 表 2 必须 包含 两 个 特殊 符号 “[” 和 “]”， 且 6(qi, [) 只 能 包含 
形 如 (9g;,[,R) 的 元 素 ，6(qi,]) 只 能 包含 形 如 (gj,], 上 ) 的 元 素 。 

定义 10.5 符号 串 w 被 一 个 线性 有 界 自动 机 接受 ， 如 果 对 于 某 个 g/EF, Xi, Xz2ET"， 存 在 一 个 
可 行 的 迁移 序列 

go[w]F [x1g mo] 


被 ba 接受 的 语言 就 是 所 有 被 接受 符号 串 构成 的 集合 。 
注意 ， 在 这 一 定义 中 ， 我 们 假设 线性 有 界 自动 机 是 非 确定 性 的 。 这 并 不 只 是 出 于 方便 的 
考虑 ， 而 且 本 质 上 对 于 讨论 lba 是 必需 的 。 当 然 我 们 也 可 以 定义 确定 型 的 lba， 但 我 们 还 不 知道 
它 是 否 与 非 确定 型 的 lba 等 价 。 本 区 习 题 8 对 这 一 问题 做 了 一 些 讨论 。 
例 10.4 语言 
L= {a'bc":n2z1} 


被 某 个 线性 有 界 自动 机 接受 。 从 例 9.8 中 的 讨论 ， 我 们 可 以 直接 得 出 这 一 结论 。 例 9.8 中 图 灵机 
的 计算 并 不 需要 原始 输入 部 分 以 外 的 空间 ， 因 此 也 可 以 被 线性 有 界 自动 机 完成 。 
例 10.5 找到 一 个 线性 有 界 自动 机 ， 使 其 接受 语言 


L={a":n20} 


解决 这 一 问题 的 一 种 方法 是 依次 用 2，3，4，… 去 整除 a 的 个 数 ， 直 到 我 们 得 出 是 接受 还 是 拒 
绝 这 符号 电 。 如 果 输 入 符号 串 属于 ， 则 景 后 必 会 剩 下 一 个 a; 如 果 不 属于 ， 则 某 一 个 整除 
必 会 出 现 一 个 长 度 不 为 0 的 余数 部 分 。 我 们 简要 描述 这 一 解决 方法 从 而 揭示 定义 10.4 中 暗含 的 
-个 策略 。 线 性 有 界 自动 机 的 带 可 以 是 多 道 的， 多 出 来 的 道 可 以 作为 草稿 区 (scratch space )。 
对 于 这 一 问题 ， 我 们 可 以 采用 2- 道 带 。 第 一 道 包含 在 整除 过 程 中 剩余 4 的 个 数 ， 第 二 道 包含 当 
前 的 除数 (图 10-18)。 具 体 的 解法 是 十 分 简单 的 。 我 们 用 第 二 道上 的 除数 去 整除 第 一 道上 a 的 
个 数 ， 比 如 我 们 可 以 删 掉 除 了 位 于 除数 整数 倍 位 置 上 的 a 以 外 的 所 有 a。 然 后 ,我 们 将 除数 加 1 ， 
并 继续 上 述 过 程 ， 直 到 遇 到 一 个 非 0 的 余数 或 者 只 剩 一 个 a 为 止 。 口 





要 检查 的 a 








图 10-18 


前 两 个 例子 表明 线性 有 界 自动 机 比 下 推 自动 机 的 功能 更 强大 ， 因 为 两 个 例子 中 的 语言 都 
不 是 上 下 文 无 关 的 。 为 了 证 实 这 一 狂想， 我 们 还 需要 证 明 任 何 一 个 上 下 文 无 关 语 言 都 可 以 被 
-个 线性 有 界 自 动机 接受 。 在 后 面 我 们 会 用 一 种 间接 的 方法 证 明 这 一 点 。 本 节 的 习题 5 和 习题 
6 提出 了 一 种 更 为 直接 的 方法 。 要 推测 图 灵机 和 线性 有 界 自动 机 之 间 的 关系 并 非 易 事 。 例 10.5 
中 的 问题 无 疑 可 以 用 线性 有 界 自动 机 解决 ， 因 为 我 们 可 以 使 用 与 输入 内 容 长 度 成 比例 的 草稿 
区 。 事 实 上 ， 要 想 给 出 一 个 具体 明确 的 不 能 被 线性 有 界 自动 机 接受 的 语言 是 相当 困难 的 。 在 
第 11 章 我 们 将 会 证 明 线性 有 界 自动 机 类 的 能 力 弱 于 未 受 限制 的 图 灵机 类 ， 但 要 给 出 一 个 这 样 
的 例子 仍 有 许多 工作 要 做 。 
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习题 


.给 出 例 10.5 中 解决 方案 的 细节 。 
.给 出 例 10.5 的 一 个 不 需要 第 二 道 草 稿 区 的 解决 方案 。 者 
.考虑 一 个 离线 图 灵机 ， 其 输入 只 能 被 从 左 至 右 地 读 一 次 ， 并 且 不 能 被 重 写 ， 其 在 带 上 至 多 
可 以 使 用 "个 多 余 的 单元 作为 工作 空间 ， 且 "对 于 所 有 输入 都 是 固定 的 。 证 明 此 类 自动 机 等 
价 于 有 穷 自 动机 。 
.给 出 接受 下 列 语言 的 线性 有 界 自动 机 。 
(a L={a:n=m,m>1} 
(pb) 工 = {a" : n 是 质数 } 
(c) 工 = {a" :7 不 是 质数 } 
(d) L= {ww : wEt{a, b}} 
(e) L= {w':wEf{a,b}',n> 1} 才 
(DL= {wwwr : wEf{a, b}*} 
.给 出 一 个 识别 例 10.5 中 语言 的 补 语言 的 lba， 设 Y= {a, b})。 
证 明 对 于 每 一 个 上 下 文 无 关 语言 ， 都 存在 一 个 接受 它 的 pda， 且 栈 中 符号 的 个 数 从 不 超过 输 
入 符号 申 的 长 度 加 1。 者 
: 利用 上 题 的 结论 证 明 任 何 一 个 不 包含 的 上 下 文 无 关 语 言 都 能 被 某 个 线性 有 界 自 动机 接受 。 
.要 定义 一 个 确定 型 的 线性 有 界 自动 机 ， 我 们 可 以 用 定义 10.4， 只 是 要 求 图 灵机 是 确定 型 的 。 
检查 你 给 出 的 习题 4 的 解决 方案 ， 它 们 都 是 确定 型 的 线性 有 界 自动 机 吗 ? 如 果 不 是 ， 请 找 出 
确定 型 的 解决 方案 。 
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现在 我 们 把 注意 力 转 回 到 主要 的 研究 兴趣 -一 形式 语言 上 来 。 在 本 章 中 ， 我 们 的 直接 目 
标 是 研究 与 图 灵机 相关 的 形式 语言 和 它们 的 一 些 约 东 条件 。 由 于 图 灵机 具有 很 强 的 计算 能 
力 ， 能 够 完成 所 有 的 算法 计算 ， 因 此 我 们 会 发 现 与 它 相 关联 的 语言 族 拥有 很 多 的 成 员 。 这 其 
中 不 仅 包 括 了 正规 语言 和 上 下 文 无 关 语 言 ， 还 包括 了 我 们 掌握 的 其 他 各 种 语言 。 然 而 ， 存 在 
这 样 一 个 重要 的 问题 一 一 是 否 存 在 某 种 不 能 被 图 灵机 所 接受 的 语言 。 为 了 回答 这 个 问题 ， 我 
们 首先 要 证 明 存 在 比 图 灵机 所 能 接受 的 语言 种 类 更 多 的 语言 。 也 就 是 要 证 明 必 然 存 在 某 些 不 
能 被 图 灵机 所 接受 的 语言 。 虽 然 这 个 证 明 方法 很 简单 清晰 ， 但 是 它 对 问题 并 没有 进行 深入 研 
究 讨 论 ， 所 以 对 我 们 理解 问题 的 本 质 并 不 是 很 有 帮助 。 因 此 ， 我 们 将 建立 具体 的 不 能 被 图 灵 
机 识别 的 语言 ， 通 过 这 个 明确 的 例子 来 证 明 这 类 语言 的 存在 性 。 除 此 之 外 ， 另 外 一 条 研究 这 
个 问题 的 途径 是 考察 图 灵机 和 一 些 特定 文法 之 间 的 关系 ， 然 后 再 在 这 些 文法 、 正 规 文法 和 上 
下 文 无 关 文法 之 间 建 立 起 联系 。 这 样 我 们 可 以 建立 起 所 有 文法 的 层次 结构 。 通 过 这 个 层次 结 
构 可 以 得 到 划分 语言 族 的 标准 。 借 助 集合 论 中 的 图 ， 我 们 可 以 很 清楚 地 解释 不 同 语言 之 间 的 
关系 。 

严格 地 讲 ， 在 本 章 中 出 现 的 很 多 论证 仅 对 不 包含 空 符号 串 的 语言 才 成 立 。 这 个 限制 是 因 
为 我 们 定义 图 灵机 不 接受 空 符号 串 引 起 的 。 为 了 避免 对 定义 的 修改 或 者 增加 一 个 重复 的 否定 
性 信息 〈 关 于 空 串 ) ， 我 们 在 这 里 假定 : 如 果 没有 特殊 说 明 ， 本 章 中 所 有 讨论 的 语言 都 不 包含 
4。 在 语言 包含 /的 情况 下 重新 闻 述 我 们 给 出 的 每 个 结论 是 不 难 的 ， 把 这 些 留 给 读者 。 


11.1 递归 语言 和 递归 可 枚 举 语言 


首先 介绍 与 图 灵机 相关 语言 的 术语 。 我 们 需要 对 图 灵机 所 接受 的 语言 和 存在 一 个 成 员 资 
格 判定 算法 的 语言 进行 严格 地 区 分 。 这 是 因为 图 灵机 对 于 本 身 不 接受 的 输入 不 一 定 总 会 停机 ， 
因此 前 者 并 不 能 包含 后 者 。 

定义 11.1 一 个 语言 L， 如 果 存 在 一 个 接受 它 的 图 灵机 ， 则 称 这 个 语言 是 递归 可 枚 举 的 
(recursively enumerable ) 。 


这 个 定义 表明 存在 一 个 图 灵机 M， 对 于 所 有 的 w EL， 满 足 
GowFw X1dHX2 


这 里 gj 是 终 态 。 这 个 定义 设 有 说 明 对 于 任何 不 在 Z 中 的 mw 会 出 现 什么 样 的 情况 。 因 此 ， 机 器 在 
eh 也 可 能 进入 了 一 个 无 穷 的 循环 而 永 不 停止 。 所 以 ， 我 们 可 以 要 
求 图 灵机 告诉 我 们 ， 给 定 的 输入 是 否 在 它 的 语言 之 中 。 

定义 11.2 让 庆生 和 通 的 jo 亲友 让 一 个 图 遇 机 所 ， 流 国 关 机 
接受 语言 L 并 且 对 了 ! 中 的 所 有 w 都 能 停机 。 搁 向 话说 ， 一 个 语言 是 递归 的 当 且 仅 当 这 个 语言 存 
在 一 个 成 员 资 格 判定 算法 。 
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如 果 一 个 语言 是 递归 的 ， 那 么 一 定 存 在 一 个 极 易 构造 的 枚 举 过 程 。 假 设 M 是 一 个 判定 递 
归 语 言 L 的 成 员 资 格 的 图 灵机 。 我 们 可 以 首先 建立 另外 一 个 图 灵机 ， 比 如 说 轩 ， 必 按照 良 序 
来 产生 2 "中 的 符号 串 ， 我 们 将 这 些 符号 串 记 为 w, wx, w, …。 当 这 些 符号 串 被 生成 之 后 ， 它 们 
成 为 了 图 灵机 M 的 输入 。 而 M 被 修改 为 仅仅 把 L 中 的 串 写 在 它 的 带 上 。 

对 于 所 有 的 递归 可 枚 举 语言 都 有 一 个 类 似 的 枚 举 过 程 这 点 ， 并 不 像 看 到 的 那样 简单 。 我 
们 不 能 按 上 述 的 方法 那样 去 做 。 因 为 如 果 某 个 wj 不 在 L 中 ， 那 么 当 M 以 w, 作 为 带 上 的 内 容 开 始 
时 ，M 可 能 永 不 停止 。 因 此 就 不 能 枚 举 Z 中 排列 到 wj 后 面 的 符号 串 。 为 了 保证 不 会 出 现 这 种 情 
况 ， 我 们 用 另外 一 种 方式 来 执行 计算 。 我 们 首先 用 故 来 生成 w ， 并 且 使 用 M 来 对 mw 执行 一 次 
迁移 。 然 后 我 们 用 用 来 生成 w,， 并 且 使 用 MM 来 对 ws 执行 一 次 迁移 ， 紧 接着 使 用 M 对 wi 执行 第 
二 次 迁移 。 在 这 之 后 我 们 生成 w3， 并 且 依 次 令 M 执 行 w; 的 第 一 次 迁移 ，w, 的 第 二 次 迁移 以 及 
w! 的 第 三 次 迁移 ， 依 此 类 推 。 具体 的 执行 顺序 在 图 11-1 里 面 进行 了 解释 。 从 这 里 ， 我 们 可 以 
清楚 地 看 到 ，M 是 不 会 进入 无 限 循 环 的 。 既 然 上 中 任意 的 符号 串 w 都 能 由 旋 生 成 并 且 在 有 限 步 
坚 内 被 M 所 接受 ， 那 么 L 中 的 所 有 符号 串 最 终 都 能 被 识别。 





wi wy 03 04 
第 一 次 迁移 。 . . e 
第 一 次 迁移 一 一 于 二 。 
第 一 次 迁移 。 

图 11-1 


如 果 一 个 语言 存在 一 个 枚 举 的 步骤 ， 那 么 它 是 递归 可 枚 举 的 。 我 们 可 以 将 给 定 的 输入 符 
号 串 和 由 枚 举 过 程 连续 产生 的 符号 串 序 列 进行 简单 的 比较 。 如 果 w EL， 我 们 最 终 能 够 得 到 一 
个 匹配 ， 那 么 这 个 过 程 就 可 以 停止 了 。 

定义 11.1 和 定义 11.2 并 没有 告诉 我 们 递归 语言 或 者 递归 可 枚 举 语言 的 本 质 性 信息 。 这 些 定 
义 只 是 将 与 图 灵机 相关 的 语言 族 中 的 成 员 和 这 些 名 称 关 联 起 来 ， 而 并 没有 展示 这 些 语言 族 成 
员 的 典型 语言 本 质 。 同 样 ， 这 些 定义 也 没有 向 我 们 展示 这 些 语 言 之 间 的 关系 或 者 这 些 语 言 
我 们 以 前 遇 到 的 语言 之 间 的 联系 。 因 此 ， 我 们 马上 就 会 遇 到 类 似 这 样 的 问题 “是 否 存在 语言 
是 递归 可 枚 举 的 但 却 不 是 递归 的 ? ”和 “是 否 存在 语言 可 以 被 清楚 地 描述 但 却 不 是 递归 可 枚 
举 的 "。 对 于 这 些 问题 ， 虽 然 我 们 可 以 给 出 一 些 答案 ,但 是 我 们 却 没 有 办 法 给 出 具体 的 例子 来 
解释 这 些 问 题 ， 特 别 是 第 二 个 。 


11.1.1 非 递归 可 枚 举 的 语言 


我 们 可 以 通过 多 种 不 同 的 方法 来 表明 这 种 非 递归 可 枚 举 的 语言 的 存在 。 其 中 有 -一 种 方法 
非常 简洁 ， 它 利用 了 数学 中 一 个 非常 基础 的 结论 。 

定理 11.1 如 果 S 是 一 个 无 穷 可 数 集合 ， 那 么 它 的 畴 集 25 不 是 可 数 的 。 
证 明 : 令 S = {s ss, s3, …}， 那 么 它 的 等 集 2* 中 的 任意 元 素 ! 都 可 以 被 表示 为 一 个 0 和 1 组 成 的 
序列 。 当 上 且 仅 当 s,; 在 t 中 出 现 ， 相 应 的 第 i 个 位 置 上 取 1。 例 如 ，{5,, 5，， 56} 可 以 被 表示 为 
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01100100… ， 而 {s1, 53，3s，… 则 会 被 表示 为 10101…。 显 然 ，2 中 的 任意 元 素 都 可 以 被 表示 
为 一 个 序列 ， 同 样 这 样 一 个 序列 也 唯一 地 代表 了 2 中 的 一 个 元 素 。 假 设 2 是 可 数 的 ， 那 么 它 
的 元 素 可 以 按照 某 种 顺序 写 出 来 ， 如 4, 2, 95…。 我 们 可 以 把 它们 写 人 一 个 表 中 ， 如 图 11-2 所 
示 。 在 这 个 表 中 ， 将 主 对 角 线 上 的 元 素 替 换 为 它 的 反 ， 即 将 主 对 角 线 上 的 0 替换 为 1，1 替 换 
为 0。 在 图 11-2 所 示 的 例子 中 ， 对 角 线 上 的 序列 是 1100…， 因 此 我 们 得 到 0011…。 比 如 对 于 
某 个 来 说 ， 替 换 之 后 的 结果 代表 了 2 中 的 某 个 元 素 。 但 是 这 个 结果 不 会 是 i ， 因 为 它 和 在 
元 素 s, 上 不 同 ， 同 样 的 道理 它 不 可 能 是 !,。、ts 或 者 是 其 他 的 1;。 这 样 就 造成 了 逻辑 上 的 矛盾 。 
因此 ，2: 是 可 数 的 假设 是 错误 的 。 国 
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这 种 论证 因为 包含 了 对 于 一 个 表 中 的 对 角 线 上 元 素 的 操作 ， 因 此 被 称 为 对 角 线 化 
(diagonalization )。 这 种 方法 是 由 数学 家 G. F. Cantor 提 出 的 ， 他 用 这 种 方法 证 明了 实数 集合 是 
不 可 数 的 。 在 接 下 来 的 几 章 中 ， 我 们 会 在 几 个 不 同 的 上 下 文中 看 到 类 似 的 论证 。 定 理 11.1 是 
对 角 线 化 最 直接 的 使 用 。 

作为 本 结论 的 直接 推论 ， 我 们 可 以 看 到 ， 在 某 种 意义 上 ， 图 灵机 的 数目 少 于 语言 的 数目 。 
因此 ， 必 然 存在 非 递归 可 枚 举 的 语言 。 

定理 11.2 对 于 任何 非 空 的 集合 了， 都 存在 非 递归 可 枚 举 的 语言 。 

证 明 : 某 个 语言 是 Z 的 一 个 子 集 ， 并 且 每 个 子 集 都 是 一 个 语言 。 因 此 ， 所 有 语言 的 集合 数目 
是 25 。 既 然 2 是 无 限 的 ， 那 么 定理 11.1 告 诉 我 们 ，Y 上 所 有 语言 构成 的 集合 是 不 可 数 的 。 但 
是 所 有 图 灵机 的 集合 是 可 以 被 枚 举 的 ， 因 此 所 有 递归 可 枚 举 的 语言 的 集合 是 可 数 的 。 通 过 本 
节 后 的 习题 16， 可 以 证 明 在 2 上 必然 存在 非 递归 可 枚 举 的 语言 。 国 

这 个 证 明 虽 然 简洁 ， 但 是 在 很 多 方面 却 不 尽 如 人 意 。 虽 然 它 告诉 我 们 非 递归 可 枚 举 的 语 
言 的 存在 ,但 对 我 们 完全 没有 建设 性 的 帮助 。 它 并 没有 告诉 我 们 任何 关于 这 种 语言 的 特征 。 
在 下 一 节 中 ， 我 们 会 更 加 清楚 地 阐述 这 个 结论 。 


11.1.2 非 递 归 可 枚 举 语 言 


既然 所 有 能 够 被 图 灵机 接受 的 语言 都 能 用 一 种 直接 的 算法 方式 描述 ， 并 且 都 是 递归 可 枚 
举 的 ， 那 么 对 于 非 递归 可 枚 举 语 言 的 描述 必然 是 非 直接 的 。 但 是 ， 这 种 描述 是 可 能 的 。 证 明 
的 过 程 使 用 了 对 角 线 化 理论 的 变种 。 

定理 11.3 存在 某 种 递归 可 枚 举 语言 ， 它 的 补 不 是 递归 可 枚 举 的 。 

证 明 : 令 2 = {a}， 并 且 考 虑 所 有 以 此 为 输入 字母 表 的 图 灵机 构成 的 集合 。 根 据 定理 10.3， 这 
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个 集合 是 可 数 的 ， 因 此 ， 我 们 可 以 按照 M1, M2:… 的 顺序 来 对 这 些 元 素 进行 排序 。 对 于 每 个 图 
灵机 M,;,， 都 会 有 一 个 相关 联 的 递归 可 枚 举 语言 L(M,)。 同 样 ， 对 于 上 每 个 递归 可 枚 举 语 言 ， 
必定 存在 某 个 能 够 接受 它 的 图 灵机 。 
现在 我 们 来 定义 一 种 新 的 语言 L。 对 于 每 个 i> 1， 符 号 串 必 属于 上 当 且 仅 当 aEZL(M;)。 因 为 
语句 a'EL(M,)， 所 以 a'<EL， 或 者 为 真 ， 或 者 为 假 ， 所 以 L 是 良 定 义 (well defined) 的 。 接 下 来 ， 
我 们 来 看 L 的 补 ， 
L={a':a' ¢L(M,)} (11-1) 


同样 ，Z 的 补 也 是 良 定义 的 ， 接 下 来 我 们 将 证 明 Z 的 补 是 非 递归 可 枚 举 的 。 
我 们 通过 反 证 法 来 证 明 Z 的 补 是 非 递归 可 枚 举 的 。 首 先 假设 元 是 递归 可 枚 举 的 。 如 果 这 个 
假设 成 立 ， 那 么 必然 存在 某 个 图 灵机 ， 比 如 说 M,， 满 足 


工 = LM,) (11-2) 


那么 对 于 符号 串 a*， 它 究竟 是 在 L 中 还 是 在 工 中 呢 ? 假 设 a*E 工 ， 那 么 由 式 (11-2) 可 得 
QEL(Mi), 但 是 式 (11-1) 意味 着 a' 纤 了 。 相 反 ， 如 果 我 们 假设 a* 在 L 中 ， 那 么 a 恰 荆 ， 那 么 式 
(11-2) 意味 着 weG@L(MD， 但 是 从 式 (11-1)， 我 们 又 可 以 得 到 aeE 工 。 通 过 这 个 矛盾 ， 我 们 可 
以 得 出 假设 不 成 立 。 因 此 亏 是 非 递归 可 枚 举 的 。 

为 了 完成 这 条 定理 的 证 明 ， 我 们 必须 证 明 L 是 递归 可 枚 举 的 。 我 们 可 以 使 用 图 灵机 的 枚 举 
过 程 来 证 明 这 一 点 。 给 定 a， 我 们 可 以 首先 通过 a 的 数目 来 确定 i。 接 下 来 ， 可 以 使 用 图 灵机 的 
枚 举 过 程 来 查找 M;。 最 后 ， 我 们 可 以 把 这 个 描述 和 a' 交 给 一 个 通用 的 图 灵机 M,， 让 M, 来 模拟 a 
在 M 上 的 处 理 过 程 。 如 果 a' 在 L 中 ， 那 么 M, 最 终 会 停机 。 这 样 的 话 ， 存 在 一 个 接受 所 有 aieL 的 
图 灵机 。 因 此 ， 根 据 定义 11.1，Z 是 递归 可 枚 举 的 。 国 

这 个 定理 的 证 明明 确 表示 了 一 个 良 定义 的 、 非 递归 可 枚 举 的 语言 。 虽 然 解释 工 是 不 容易 
的 ， 我 们 可 能 只 能 展示 其 中 的 一 小 部 分 成 员 。 但 是 ， 我 们 毕竟 得 到 了 天 的 确切 定义 。 


11.1.3 递归 可 术 举 但 非 递归 的 语 青 


接 下 来 ， 我 们 会 证 明 有 些 语言 是 递归 可 枚 举 的 ， 但 是 却 不 是 递归 的 。 同 样 ， 我 们 这 次 也 
要 通过 一 个 迁 回 的 方法 来 证 明 。 我 们 首先 要 建立 一 个 辅助 性 的 结论 。 

定理 11.4 ”如果 一 个 语言 L 和 它 的 补 工 前 是 递归 可 枚 举 的 ， 那 么 两 者 都 是 递归 的 。 如 果 L 是 
递归 的 ， 那 么 元 也 是 递归 的 ， 同 时 两 者 都 是 递归 可 枚 举 的 。 
证 明 : 如 果 Z 民 和 它 的 补 三 都 是 递归 可 枚 举 的 ， 那 么 存在 图 灵机 M 和 诊 来 分 别 作为 和 天 的 枚 举 
过 程 。 第 一 个 图 灵机 会 产生 !L 中 的 w, w, …， 第 二 个 产后 开 中 的 遍 , 加 ，…。 现 在 假设 任意 给 定 
的 wEZ*， 我 们 首先 可 以 通过 MM 来 生成 w, 并 和 w 进 行 比较 。 如 果 它 们 不 一 样 ， 我 们 可 以 通过 应 
来 生成 如 并 和 w 再 进行 比较 。 如 果 仍 不 相同 ， 我 们 可 以 通过 M 来 生成 ww 并 和 w 进 行 比较 ， 让 来 
产生 名， 依 此 类 推 。 任 意 的 wE2* 都 会 被 M 或 者 府 生 成 ， 这 样 我 们 最 终 会 得 到 一 个 匹配 。 如 果 
匹配 的 符号 串 是 由 M 产 生 的 ， 那 么 w 属 于 L， 否 则 w 在 荆 中 。 这 个 处 理 过 程 是 L 和 荆 的 成 员 资 格 
判定 算法 ， 因 此 它们 都 是 递归 的 。 

相反 ， 如 果 我 们 假设 是 递归 的 。 那 么 对 它 必然 存在 一 个 成 员 资 格 判定 算法 。 我 们 可 以 通 
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过 对 这 个 算法 的 结论 求 补 来 使 得 它 成 为 L 补 的 成 员 资 格 判 定 算 靶 。 因 此 工 也 是 递归 的 。 既 然 任 
意 的 递归 语言 都 是 递归 可 枚 举 的 ， 因 此 结论 成 立 。 国 

从 这 里 ， 我 们 可 以 直接 得 出 递归 可 枚 举 语言 族 与 递归 语言 族 是 不 等 同 的 。 定 理 11.3 中 的 语 
言 工 属于 第 一 个 族 ， 但 是 不 属于 第 二 个 族 。 

定理 11.5 ”存在 一 个 递归 可 枚 举 语言 也 但 却 不 是 递归 的 ， 换 向 话说 ， 递 归 语 言 族 是 递归 可 
枚 举 语 言 族 的 真子 集 。 
证 明 : 定理 11.3 中 的 语言 Z 是 递归 可 枚 举 的 ， 但 它 的 补 不 是 。 因 此 ， 根 据 定理 11.4， 它 不 是 递 
归 的 ， 这 个 例子 就 可 以 证 明 结论 。 国 

从 这 里 ， 我 们 还 可 以 得 出 ， 确 实 存在 无 法 为 其 构造 成 员 资格 判定 算法 的 良 定义 的 语言 。 


习题 


证 明 实 数 集合 是 不 可 数 的 。 

证 明 所 有 非 递归 可 枚 举 语言 组 成 的 集合 是 不 可 数 的 。 乔 

设 Z 是 有 限 语言 。 证 明 忆 是 递归 可 枚 举 的 。 提 示 建 立 性 的 枚 举 过 程 。 

设 L 是 上 下 文 无 关 语 言 ， 证 明 L! 是 递归 可 枚 举 的 。 提 示 建 立 L* 的 枚 举 过 程 。 

证 明 一 个 非 递归 可 枚 举 语言 ZL 的 补 不 是 递归 的 。 

.证 明 递归 可 枚 举 语 言 族 在 并 运算 下 是 封闭 的 。 乔 

.递归 可 枚 举 语 言 族 在 交 运 算 下 是 否 是 封闭 的 ? 

.证 明 递 归 语 言 族 在 并 运算 和 交 运 算 下 是 封闭 的 。 

证 明 递 归 语 言 族 和 递归 可 枚 举 语言 族 在 逆 运 算 下 是 封闭 的 。 

10. 递归 语言 族 在 连接 运算 下 是 封闭 的 吗 ? 

11. 证 明 上 下 文 无 关 语言 的 补 必 然 是 递归 的 。 大 

12. 设 乙 是 递归 语言 、 忆 是 递归 可 枚 举 语 言 。 证 明 疡 - 瑟 一 定 是 递归 可 枚 举 的 。 

13. 假设 存在 某 个 图 灵机 能 够 按照 适当 的 顺序 枚 举 出 上 中 的 元 素 ， 证 明 这 意味 着 是 递归 的 。 

14. 设 L 是 递归 语言 ,是否 L' 也 是 递归 的 ? 大 

15. 选择 一 个 特定 编码 方式 的 图 灵机 ，、 并 利用 它 来 产生 定理 11.3 中 语言 的 元 素 。 

16. 设 $, 是 可 数 集合 ，5, 是 不 可 数 集合 ， 并 且 $1 C 5,。 证 明 5, 中 必然 包含 无 数 个 不 属于 5 的 元 
素 。 

17. 证 明 在 习题 16 中 产生 的 集合 $, - 51 不 可 能 是 可 数 的 。 

18. 为 什么 定理 11.1 的 证 明 当 5 是 无 穷 时 不 能 成 立志 

19. 证 明 所 有 无 理 数 组 成 的 集合 是 不 可 数 的 。 


11.2 无 限制 文法 


为 了 考察 递归 可 枚 举 的 语言 和 文法 之 间 的 联系 ， 我 们 再 回 过 头 来 看 看 第 1 章 中 对 于 文法 的 
一 般 性 定义 。 在 定义 1.1 中 ， 产 生 式 规则 可 以 采用 任意 形式 ， 但 是 后 来 我 们 看 到 的 特定 文法 都 
被 加 上 了 各 种 各 样 的 限制 。 如 果 采 用 一 般 性 的 方式 并 且 不 强加 任何 的 限制 ， 我 们 会 得 到 无 限 
制 文法 。 


OP ow- 


kD 
ft 
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定义 11.3 文法 G = (V, 7T, 5, 了 ) 被 称 为 无 限制 文法 (unrestricted grammar) 当 且 仅 当 它 的 
每 个 产生 式 都 有 形式 


这 里 4 属于 (VUD)*， 而 v 属 于 (VU7T)，。 

在 一 个 无 限制 文法 中 ， 基 本 上 没有 对 产生 式 强 加 任何 条 件 。 任 意 数目 的 变量 和 终结 符 都 
可 以 出 现在 左 端 或 者 右 端 ， 并 且 可 以 以 任意 顺序 出 现 。 这 里 唯一 的 一 个 限制 就 是 不 能 作为 一 
个 产生 式 的 左 部 。 

正如 我 们 所 见 ， 无 限制 文法 比 我 们 目前 所 研究 的 受 限 制 文法 ， 如 上 下 文 无 关 文 法 和 正则 
文法 具有 更 强 的 表达 能 力 。 事 实 上 ， 无 限制 文法 对 应 了 我 们 使 用 机 械 方法 所 能 识别 的 最 大 语 
言 族 。 即 无 限制 文法 生成 了 递归 可 枚 举 的 语言 族 。 我 们 将 通过 两 个 部 分 来 证 明 这 一 点 ; 第 一 
部 分 相当 直接 ， 但 是 第 二 部 分 则 需要 一 个 较 长 的 构造 过 程 。 

定理 11.6 任何 由 无 限制 文法 生成 的 语言 都 是 递归 可 枚 举 的 。 
证 明 : 文法 实际 上 定义 了 如 何 系统 地 枚 举 相应 语言 中 所 有 符号 串 的 过 程 。 例 如 ， 我 们 可 以 将 
中 所 有 注 足 下 面 推 导 的 w 列 出 来 


Sw 


即 w 是 一 步 推 出 的 。 既 然 文法 产生 式 的 集合 是 有 限 的 , 那么 这 种 符号 的 数目 就 是 有 限 的 。 接 着 ， 
我 们 可 以 列举 出 所 有 在 L 中 w， 并 且 由 两 步 推导 出 来 的 符号 串 


S—Xx=—>w 


依 此 类 推 。 我 们 可 以 在 图 灵机 上 模拟 这 种 推导 过 程 。 因 此 ， 我 们 存在 一 个 这 种 语言 的 枚 举 过 
程 ， 所 以 它 是 递归 可 枚 举 的 。 国 

无 限制 文法 和 递归 可 枚 举 的 语言 之 间 的 这 种 对 应 关系 是 很 自然 的 。 文 法 可 以 通过 一 个 良 
定义 的 算法 步 又 生成 符号 串 ， 因 此 ， 这 个 推导 过 程 可 以 在 图 灵机 上 实现 。 为 了 显示 其 反面 ， 
我 们 描述 如 何 用 无 限制 文法 模拟 任 给 的 图 灵机 。 ， 

给 定 一 个 图 灵机 M = (Q, ,T, 6, qo, 口 , F)， 我 们 来 构造 一 个 无 限制 文法 G， 满 足 L(G) = 
L(M)。 构 造 的 思想 相对 比较 简单 ， 但 是 具体 实现 却 比 较 麻 烦 。 

既然 图 灵机 的 计算 过 程 可 由 如 下 瞬时 描述 序列 表示 


GowFx9g1y (11-3 ) 
我 们 可 以 排列 它 使 得 当 且 仅 当 式 (11-3) 成 立时 ， 相 应 的 文法 具有 如 下 特性 : 
qow >xqg/y (11-4) 
接 下 来 ， 对 于 所 有 满足 条 件 式 (11-3) 的 w， 我 们 需要 在 式 (11-4) 和 我 们 需要 的 形式 
Sw 


之 则 建立 关联 。 为 了 完成 这 个 关联 的 建立 ， 我 们 定义 一 个 文法 ， 它 大 体 上 有 如 下 特性 : 
1. 对 于 所 有 的 wEZ*，5 都 可 以 推导 出 gow。 
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2. 当 且 仅 当 式 (11-3) 成 立时 ， 才 可 能 有 式 (11-4)。 
3. 当 符号 串 xqgmy (9/EF) 生成 时 ， 文 法 将 符号 串 转换 为 最 初 的 w。 
完整 的 推导 过 程 如 下 : 


S$ >qow xqgy Sw (11-5) 


上 述 推 导 过 程 中 的 第 三 步 比 较 麻烦 。 问 题 在 于 ， 如 果 w 在 第 二 步 里 被 修改 了 ， 那 么 文法 如 何 
保存 w? 我 们 通过 对 符号 串 进行 编码 来 解决 这 个 问题 。 在 开始 时 ， 让 系统 拥有 w 的 两 份 拷贝 。 
第 一 个 被 保存 ， 第 二 个 在 式 (11-4) 中 使 用 。 当 进入 最 终 格局 时 ， 文 法 将 清除 w 之 外 的 所 有 
符号 。 

为 了 产生 w 的 两 份 拷贝 ， 并且 为 了 处 理 M 的 状态 符号 (最终 会 被 文法 清除 )， 对 于 所 有 的 
aEZU{Dj}, bET 以 及 所 有 满足 9;EQ 的 i， 我 们 引入 变量 V,, 和 Vi,。 变 量 V, 对 符号 a 和 4 编码， 而 
Vaw 则 同时 对 a、b 和 状态 q,; 进 行 编码 。 

式 (11-5) 中 的 第 一 步 可 以 这 样 得 到 : 









































S->YVDnDSlSYcDlIT (11-6) 
T—>TV,alVooo ( 11-7 ) 
其 中 aE%。 这 种 推导 允许 文法 对 于 任意 的 符号 捉 qow 产 生 编 码 的 版 本 。 这 里 的 gow 前 面 和 后 面 


都 可 以 有 任意 多 的 空格 符 。 
对 于 第 一 步 ， 对 每 个 关于 4 的 转换 
6(qc) = (ad,R) 
我 们 都 添加 文法 产生 式 
Va Vos > VaaV,; (11-8) 


其 中 所 有 的 4，pEYU{ 口 }，gET。 对 于 MM 的 每 个 

6(g;, c) = (q;, d, L) 
我 们 都 在 G 中 添加 

Vo Vie >V 


pq aic P14 


Vag (11-9) 


其 中 所 有 的 a，pEX%U{ 口 }，gET。 
如 采 人 在 第 一 步 中 ，M 就 进入 了 一 个 终 态 ， 则 文法 必须 清除 w 之 外 的 所 有 符号 ，w 保 存在 Y 中 


Vas—>a (11-10) 
这 样 就 得 到 了 符号 串 中 的 第 一 个 终结 符 ， 对 于 所 有 的 a，cEFU{ 口 }，bET， 上 式 可 以 重 写 为 

CT 一 ca (11-11) 

Vasc—>ac (11-12) 


我 们 还 需要 另外 - -个 特殊 的 产生 式 


[wa 
un 
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口 =4 (11-13) 


最 后 一 个 产生 式 处 理 了 当 MM 移 出 输入 w 所 占 的 带 区 域 的 情况 。 为 了 在 这 种 情况 下 能 够 正常 工作 ， 
我 们 首先 使 用 式 (11-6) 和 式 (11-7) 产生 
口 … 口 gw 口 … 口 
来 代表 所 有 使 用 过 的 带 区 域 。 其 他 无 关 的 空格 符 都 由 式 (11-13) 除去 。 
接 下 来 的 例子 揭示 了 这 个 复杂 的 构造 过 程 。 和 仔细 检 查 例子 的 每 一 步 ， 看 看 各 产生 式 做 些 
什么 ， 为 什么 需要 它们 。 
例 11.1 对 于 图 灵机 M = (Q, ,TT, 6, go, 口 ,下 ), 邻 
Q = {qo, 491} 
T= {a,b, 0} 
> = {a, b} 
F={q} 
6(go, a) 三 (qdo， a, R) 
6(qo, [1) = (qi1, DD, L) 
该 图 灵机 接受 L(aa )。 
现在 考虑 接受 符号 串 aa 的 计算 
doaaHF aqoaHFaadoDjHacgia 吕 (11-14) 


为 了 能 够 用 C 推 导出 这 个 符号 串 ， 我 们 首先 使 用 式 (11-6) 和 式 (11-7) 中 的 规则 来 得 到 相应 
的 初始 符号 串 。 
9 一 SYDD 一 TYDo 一 TY。YpD 一 YooYYDD 
最 后 一 个 句 型 用 于 模拟 图 灵机 上 计算 的 推导 部 分 ， 是 推导 的 出 发 点 。 它 在 第 一 个 索引 中 包含 
了 原始 输入 aa[， 在 其 余 的 索引 中 包含 初始 瞬时 描述 qoaa 口 。 接 下 来 ， 我 们 使 用 
Voaoe Ya 一 Vaa Voaoa 
Vioa Vo > Voa Vi MD ( 式 (11-8) 的 特例 ) 
































以 及 





VoaVooo 悦 VaraVoo (来 自 式 (11-9)) 
由 上 述 三 个 产生 式 ， 我 们 得 到 如 下 推导 步 又 
VaoaVaa VO VoaVooa VO Vaa Vaa VO Voa VotaV 
第 一 个 索引 序列 保持 不 变 ， 始 终 记录 着 原始 的 输入 。 其 他 索引 的 序列 为 
0aa[L], a0a[]j, aa00, ala0D 


它 和 式 《11-14) 中 的 瞬时 描述 序列 等 价 。 
最 后 ， 将 式 (11-10) 至 式 (11-13) 用 在 最 后 一 步 中 ， 可 得 如 下 推导 
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VaaVaaV on VaV om Va =aaL =aa 


式 (11-6) 至 式 (11-13) 中 描述 的 构造 是 证 明 下 面 结论 的 基础 。 口 
定理 11.7 对 于 每 一 个 递归 可 枚 举 语言 L， 和 有 在 一 个 无 限制 文法 G， 满 足 L = L(GO)。 
证 明 : 上 述 构 造 保证 了 如 果 x 上 ->y， 那 么 e(x) 二 e(y)， 这 里 e(x) 代表 了 一 个 符号 串 根 据 给 定 的 规 
定 得 到 的 编码 。 根 据 对 转换 步 数 的 归纳 ， 我 们 可 以 得 到 
e(qow) >e(y) 
当 且 仅 当 qowFy 成 并 。 我 们 还 必须 证 明 ， 我 们 可 以 生成 每 个 可 能 的 初始 格局 ， 并 且 当 且 仅 当 M 


进入 一 个 终止 格局 时 重 构 w。 具 体 的 证 明 过 程 不 是 很 难 ， 留 做 习题 。 攻 
这 两 个 定理 表明 : 无 限制 文法 相应 的 语言 族 与 递归 可 枚 举 的 语言 族 是 等 同 的 。 

















习题 
1. 下 面 的 无 限制 文法 可 推导 出 什么 样 的 语言 ” 六 
S—SIB 
Si—aSib 
bB-—>bbbB 
aSib—aa 
B—>A 
2. 在 无 限制 文法 中 ， 如 果 我 们 允许 空 串 作 为 产生 式 的 左 部 ， 那 么 我 们 会 遇 到 什么 样 的 困 
难 ? 
3. 如 果 对 文法 进行 修改 ， 使 得 推导 的 开始 点 是 一 个 符号 串 的 有 限 集合 ， 而 不 是 一 个 变量 。 把 


这 个 概念 形式 化 ， 然 后 研究 如 何 将 这 种 文法 和 我 们 这 里 用 过 的 无 限制 文法 联系 起 来 。 各 
:证明 例 11.1 中 的 文法 不 能 生成 含有 2 的 句子 。 

.给 出 定理 11.7 的 详细 证 明 。 

.为 语言 上 (01(01) ) 构造 图 灵机 ， 然 后 根据 定理 11.7 找 出 相应 的 无 限制 文法 ， 并 利用 该 文法 给 
出 0101 的 推导 过 程 。 


Sn 上 


7. 证 明 对 于 每 个 无 限制 文法 都 存在 一 个 等 价 的 无 限制 文法 ， 其 所 有 的 产生 式 都 有 如 下 的 形式 
U—>V 
这 里 u,vE(VUT)*， 并 且 |uj < |v|, 或 
4 一 人 


这 里 4EY。 海 
: 证 明 如 果 对 习题 7 中 的 文法 增加 更 多 的 条 件 |u| < 2 和 |v| < 2， 那 么 结论 仍然 成 立 。 
9. 对 于 无 限制 文法 ， 有 些 学 者 给 出 了 与 定义 11.3 截 然 不 同 的 定义 。 在 他 们 的 定义 中 ， 对 于 无 
限制 文法 的 产生 式 都 要 有 如 下 形式 


Oo 


XYy 


kD 
oo 
> 


[Na 
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这 里 xE(VUT)V(VUT) 且 yE(VUT)"。 区 别 在 于 这 里 的 产生 式 左 部 至 少 要 有 一 个 变量 。 
证 明 这 种 定义 和 我 们 所 使 用 的 定义 在 下 面 意义 上 基本 是 相同 的 : 对 一 种 类 型 的 每 个 文 
法 都 存在 等 价 的 另 一 种 类 型 的 文法 。 


11.3 上 下 文 相关 文法 和 语言 


在 限制 的 、 上 下 文 无 关 文 法 和 一 般 的 、 无 限制 文法 之 间 ， 存 在 大 量 的 在 一 定 程度 上 受 限 
制 的 文法 。 不 是 所 有 的 情况 都 令 人 感 兴 趣 ， 在 这 其 中 ， 上 下 文 相关 文法 值得 我 们 关注 。 这 些 
文法 生成 的 语言 和 受 限 的 图 灵机 类 相关 联 ， 即 我 们 在 10.5 节 中 介绍 的 线性 有 界 自动 机 。 

定义 11.4 文法 G = (V, T, 5S, P) 是 上 下 文 相关 的 (context-sensitive )， 如 果 它 的 所 有 产生 
式 都 有 如 下 形式 


这 里 x, yE(VU7T)*,， 并且 
xl< by (11-15) 


这 个 定义 清楚 地 表明 了 这 类 文法 的 一 个 特征 : 在 推导 过 程 中 ， 后 继 句 型 的 长 度 是 不 会 减 
小 的 ， 在 这 个 意义 上 ， 上 下 文 相关 文法 是 不 会 收缩 的 (noncontracting )。 虽 然 为 什么 称 这 种 文 
法 为 上 下 文 相关 文法 不 是 很 明显 ， 但 是 可 以 看 到 这 种 文法 可 以 用 一 种 范式 (如 Salomaa 1973) 
来 改写 ， 其 中 所 有 的 产生 式 都 有 如 下 形式 


XAy—>xvy 
这 也 是 说 产生 式 4 一 v 仅 当 在 4 的 左边 为 x-， 右 边 为 y 的 这 种 上 下 文 情况 下 才能 被 使 用 。 


11.3.1 上 下 文 相关 语言 和 线性 有 界 自动 机 


顾名思义 ， 上 下 文 相关 文法 和 同名 的 语言 族 是 联系 在 一 起 的 。 
定义 11.5 ”语言 L 是 上 下 文 相关 语言 当 且 仅 当 存在 一 个 上 下 文 相关 文法 G， 满 足 L = L(G) 
或 者 L = L(G)U{4}。 
.在 定义 中 ， 我 们 又 引入 了 空 串 。 定 义 11.4 瞳 示 了 不 允许 有 x 一 4， 因此 一 个 上 下 文 相关 文法 
是 不 会 生成 包含 有 空 串 的 语言 的 。 而 每 个 不 包含 /的 上 下 文 无 关 语言 都 可 以 由 一 个 上 下 文 相关 
文法 的 特例 ， 比 如 乔 姆 斯 基 范 式 或 格 里 巴克 范式 (这 两 个 范式 都 符合 定义 11.4 的 条 件 ) 来 生 
成 。 通 过 在 上 下 文 相关 语言 (而 不 是 在 文法 中 ) 中 引入 空 种 ， 我 们 可 以 说 上 下 文 无 关 语 言 的 
集合 是 上 下 文 相关 语言 集合 的 一 个 子 集 。 
例 11.2 工 = {a"b"c": n>1} 是 上 下 文 相关 语言 。 我 们 通过 为 它 构造 一 个 上 下 文 相关 文法 来 
表明 这 点 。 具 体 文法 如 下 : 
S—abclaAbc 
Ab—bA 
4c 一 Bpcc 
5B-BB 


aB—aalaaA 
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我 们 通过 展示 ab*c 的 推导 过 程 来 看 看 该 文法 是 如 何 起 作用 的 。 
S—aAbc=—abAc=abBbcc 
=—>aBbbcc—>aaAbbcc—aabAbcc 
=>aabbAcc=>aabbBbccecc 
=>aabBbbccc—>aaBbbbccc 
~—»aaabbbccc 


这 个 解决 方案 有 效 地 使 用 了 变量 4 和 B 作 为 消息 的 传递 者 。 每 当 左边 产生 一 个 4， 它 就 一 直 向 
右 移动 直到 遇 到 第 一 个 c， 此 时 又 产生 了 另外 的 5 和 ec。 接 下 来 它 将 8 送 回 到 左边 以 便 产生 相应 
的 ec。 整个 过 程 与 接受 语言 Z 的 图 灵机 的 工作 过 程 非常 类 似 。 口 

因为 上 面 例 子 中 的 语言 不 是 上 下 文 无 关 的 ， 所 以 我 们 可 以 看 到 上 下 文 无 关 语 言 族 是 上 下 
文 相关 语言 族 的 -- 个 真子 集 。 例 11.2 同 样 也 表明 了 : 即使 是 为 一 个 相对 简单 的 例子 构造 相应 
的 上 下 文 相关 文法 也 不 是 很 容易 的 事 。 通常， 最 容易 的 解决 办 法 是 首先 在 图 灵机 上 获得 程序 ， 
然后 再 找到 … 个 等 价 的 文法 。 一 些 例 子 表明 对 于 上 下 文 相关 语言 ， 相 应 的 图 灵机 有 可 预测 空 
间 的 要 求 。 实 际 上 ， 它 可 以 被 看 作 是 一 种 线性 有 界 自 动机 。 

定理 11.8 ”对 于 每 个 不 包括 A 的 上 下 文 相 关 语 言 L， 询 存在 某 个 线性 有 界 自动 机 M， 满 足 L = 
LM). 
证 明 : 如 果 L 是 上 下 文 相 关 的 ， 那 么 对 于 L {4} 存在 一 个 上 下 文 相关 文法 。 我 们 将 说 明 如 何 将 
文法 中 的 推导 过 程 在 线性 有 界 自 动机 上 模拟 出 来 。 线 性 有 界 自 动机 有 两 个 酚 ， 一 个 包含 了 输 
人 符号 串 w， 另 外 一 个 包含 了 用 G 推 导出 来 的 句 型 。 证 明 的 关键 点 在 于 所 有 可 能 的 句 型 长 度 都 
不 会 超过 |w|。 另 外 一 个 值得 注意 的 是 这 个 线性 有 界 自动 机 是 非 确 定型 的 。 在 证 明 中 ， 这 一 点 
是 必需 的 ， 这 样 ， 我 们 就 可 以 说 正确 的 产生 式 总 能 被 猜测 出 来 而 不 必 去 追踪 无 效 的 产生 式 选 
择 。 因 此 ， 定 理 11.6 中 描述 的 计算 过 程 可 以 被 执行 。 而 且 这 种 执行 过 程 ， 除 了 最 初 w 占 据 的 空 
间 之 外 ， 不 需要 额外 的 空间 。 即 它 可 以 由 线性 有 界 自动 机 来 执行 。 妖 

定理 11.9 ”如果 语言 L 被 某 个 线性 有 界 自 动机 MM 接受 ， 那 么 就 存在 某 个 能 够 产生 上 的 上 下 文 
相关 文法 。 
证 明 : 文法 的 构造 过 程 和 定理 11.7 中 的 过 程 类 似 。 定 理 11.7 中 生成 的 所 有 产生 式 里 ， 除 了 式 
(11-13) 口 一 4 以 外 ， 都 是 不 会 收缩 的 。 但 是 式 (11-13) 这 个 产生 式 可 以 被 忽略 掉 。 这 个 产 
生 式 仅 当 图 灵机 读 写 头 移出 了 原始 输入 的 边界 时 才 会 使 用 到 ， 但 在 这 里 不 会 出 现 这 种 情况 。 
这 样 ， 由 不 含 非 必需 产生 式 的 构造 过 程 得 到 的 产生 式 都 是 不 会 收缩 和 的， 证 明 完 成 。 恕 


11.3.2 递归 语言 和 上 下 文 相关 语言 的 关系 


定理 11.9 告 诉 我 们 每 个 上 下 文 相关 语言 都 能 被 某 个 图 灵机 所 接受 ， 因 此 是 递归 可 枚 举 的 。 
由 此 极 易 得 到 定理 11.10。 

定理 11.10 每 个 上 下 文 相 关 语 言 L 都 是 递归 的 。 
证 明 : 给 定 上 下 文 相关 语言 L 和 相关 的 上 下 文 相关 文法 G， 我 们 来 看 一 下 w 的 推导 过 程 


SX Ww 


不 失 一 般 性 地 ， 我 们 可 以 假设 在 一 单个 的 推导 过 程 中 ， 所 有 的 句 型 都 是 不 同 的 ; 即 对 于 所 有 





LS 
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的 i*j， 有 x;*x)。 证 明 的 难点 在 于 要 证 明 任意 推导 过 程 的 步 数 都 是 |w| 的 一 个 有 界 函 数 。 我 们 
知道 G 是 不 会 收缩 的 ， 所 以 


x < lx, | 
此 外 ， 我 们 唯一 要 做 的 就 是 根据 G 和 w 来 找到 某 个 m， 使 得 对 于 所 有 的 }j， 都 满足 
lx < hw, 


其 中 m = m(|wj) 是 |VUTI 和 |w| 的 有 和 界 函 数 。 由 于 |VUTI 的 有 界 性 意味 着 只 有 有 限 个 给 定 长 度 的 符 
号 种， 所 以 这 样 的 m 是 存在 的 。 因 此 wEzZ 的 推导 长 度 是 不 会 超过 |wjm(lwl) 的 。 

通过 上 面 的 步骤 ， 我 们 可 以 很 快 给 出 Z 的 一 个 成 员 资格 判定 算法 。 我 们 检查 所 有 在 长 度 上 
界 |w|m(jwl) 之 内 的 推导 。 因 为 G 的 产生 式 是 有 限 的 ， 所 以 这 些 步 又 也 是 有 限 的。 如 果 在 这 些 步 
又 里 面 能 够 产生 w， 那 么 wEL ， 否 则 w 就 不 在 中 。 国 

定理 11.11 看 在 不 是 上 下 文 相关 的 递归 语言 。 
证 明 : 考虑 7 = {a,b} 上 的 所 有 上 下 文 相关 文法 。 我 们 用 常规 的 方式 来 表示 文法 ， 每 个 文法 都 
有 一 个 形 如 

V= {Vo, Vi, V2, …} 


的 变量 集合 。 每 个 上 下 文 相关 文法 都 由 它们 的 产生 式 来 说 明 。 我 们 可 以 把 这 些 产生 式 写成 一 
个 单独 的 符号 串 
XY X22 Xm Ym 

用 下 面 的 同 态 关系 作用 于 该 符号 串 

h(a) = 010 

h(b) = 0120 

h(—) = 0130 

h(:;) = 0140 

h(V,) = 01'+50 


这 样 ， 任 何 上 下 文 相关 文法 都 可 以 被 唯一 地 表示 为 L((011"0)”) 中 的 符号 串 。 不 仅 如 此 ， 这 种 
转换 是 可 逆 的 ， 即 对 于 L((0110)") 中 的 任意 符号 申 ， 至 多 有 -个 上 下 文 相关 文法 与 其 对 应 。 

让 我 们 引入 {0, 1}* 上 的 适当 排序 ， 以 便 我 们 可 以 将 符号 串 按 顺 序 写成 w, w;, …。 对 于 一 
个 给 定 的 符号 电 w 可 能 没有 上 下 文 相关 文法 与 之 对 应 ， 如 果 有 ， 我 们 将 它 称 为 G,。 接 下 来 ， 我 
们 定义 语言 L = {wi: 由 定义 了 上 下 文 相关 文法 G 并 且 wEL(G)}。L 是 良 定义 的 ， 并 且 实际 上 是 
递归 的 。 为 了 证 明 这 一 点 ， 我 们 可 以 为 它 构 造 一 个 成 员 资格 判定 算法 。 对 给 定 的 符号 串 w ， 
我 们 检查 它 是 否定 义 了 一 个 上 下 文 相关 文法 G,， 如 果 没 有 ， 那 么 wEL。 如 果 访 符号 串 定义 了 
一 个 上 下 文 相关 文法 ， 那 么 L(G;) 是 递归 的 ， 我 们 可 以 利用 定理 11.10 中 的 成 员 资格 判定 算法 查 
明 是 否 有 wiEL(G)。 如 果 没 有 ， 则 w 在 L 中 。 

但 是 L 不 是 上 下 文 相关 的 。 如 果 它 是 上 下 文 相 关 的 ， 那 么 会 存在 某 个 G,， 满 足 L = L(G)。 
那么 我 们 要 问 ，w 是 否 在 L(G)) 中 。 如 果 假 设 wEL(G)， 那 么 根据 定义 可 知 w 不 在 中 。 但 是 
= L(G)， 因 此 出 现 了 了 矛盾。 相反 ， 如 果 我 们 假设 w 兵 L(G)， 那 么 根据 定义 可 知 wEL(G)， 又 
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会 出 现 另 一 个 矛盾 。 所 以 Z 不 是 上 下 文 相 关 的 。 国 

定理 11.11 的 结论 表明 了 线性 有 界 自动 机 确实 不 如 图 灵机 的 能 力 强 ， 因 为 它们 接受 的 只 是 
递归 语言 的 真子 集 。 同 时 ， 我 们 也 可 以 看 到 线性 有 界 自动 机 确实 比 下 推 自动 机 的 能 力 强 。 上 
下 文 无 关 文法 产生 的 上 下 文 无 关 语 言 是 上 下 文 相关 语言 的 子 集 ; 而 且 正如 例子 所 示 ， 是 真子 
集 。 由 于 线性 有 界 自动 机 和 上 下 文 相 关 语 言 在 本 质 上 是 等 价 的 ， 且 下 推 自动 机 和 上 下 文 无 关 
语言 本 质 上 也 是 等 价 的 ， 所 以 我 们 可 以 看 到 : 所 有 下 推 自动 机 接受 的 语言 同样 也 能 被 线性 有 
界 自动 机 所 接受 。 但 是 ， 有 些 语言 能 够 被 线性 有 界 自动 机 所 接受 却 不 能 被 下 推 自动 机 接受 。 


习题 


太 1. 为 下 列 语言 构造 上 下 文 相关 文法 : 
(a L={a"*'pc" :21 
(b) L= {a"b"a” > 
(OL= {arbrcerd :n>21,m> 1}) 物 
(d) L= {ww : wEtf{a, b}'} 
太 2. 为 下 列 语言 构造 上 下 文 相关 文法 : 
(a) LL= {Ww :nAw) = mw) = nw)} 
(DL= {Ww: nw) = nw) <n(w)) 
3. 证明 上 下 文 相关 语言 族 对 于 并 运算 是 封闭 的 。 
4. 证 明 上 下 文 相 关 语言 族 对 于 逆 运 算是 封闭 的 。 各 
5. 对 于 定理 11.10 中 的 m， 给 出 以 lw| 和 |VUT7TI 函 数 形式 表述 的 关于 m 的 上 界 。 
6. 证明: 对 于 L = {wuw :w, uE{a, b}'} 存 在 相应 的 上 下 文 无 关 文 法 (不 需要 给 出 严格 的 构造 过 
程 )。 获 


11.4 乔 姆 斯 基层 次 结构 


我 们 现在 已 经 见 过 了 很 多 种 语言 族 ， 其 中 包括 递归 可 枚 举 的 语言 族 (Lrs)、 上 下 文 相关 
语言 族 (Lcs)、 上 下 文 无 关 语 言 族 (ZLcr) 和 正则 语言 族 (Zasc)。 它 们 之 间 的 关系 可 以 采用 乔 
姆 斯 基层 次 结构 (Chomsky hierarchy ) 来 表示 。Noam Chomsky， 形式 语言 理论 的 英 基 人 ， 
给 出 了 形式 语言 最 初 的 分 类 。 他 把 这 些 语言 分 成 4 种 类 型 ， 从 0 型 到 3 型 。 人 们 还 在 使 用 最 初 的 
术语 ， 用 0 型 到 3 型 来 命名 我 们 所 研究 的 各 种 语言 。0 型 语言 是 由 无 限制 文法 生成 的 ， 即 递归 可 
枚 举 的 语言 。1 型 语言 由 上 下 文 相关 语言 构成 ，2 型 语言 由 上 下 文 无 关 语 言 构成 ，3 型 语言 由 正 
则 语言 构成 。 正 如 我 们 看 到 的 ， 每 个 型 语言 族 是 ;- 1 型 语言 族 的 真子 集 。 图 示 (图 11-3) 可 
以 明确 地 展示 它们 之 间 的 关系 。 图 11-3 展 示 了 最 初 的 乔 姆 斯 基层 次 结构 ， 在 我 们 学 过 的 语言 
族 中 ， 还 有 几 种 语言 族 适 合 于 分 配 到 这 个 图 中 。 包 括 确定 型 上 下 文 无 关 语言 族 (Lpcs) 和 递 
归 语 言 族 (Lasc)， 将 这 两 个 语言 族 加 入 到 最 初 的 层次 结构 中 进行 扩充 ， 得 到 的 结果 如 图 11-4 
所 示 。 

可 以 定义 其 他 的 语言 族 并 且 研 究 它们 在 图 11-4 中 的 位 置 ， 虽 然 它们 之 间 不 一 定 具有 图 11-3 
和 图 11-4 中 所 示 的 那 种 嵌 套 关系 。 在 一 些 实例 中 ， 它 们 之 间 的 关系 到 现在 还 不 是 很 明确 。 
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图 11-4 


例 11.3 我 们 以 前 介绍 过 上 下 文 无 关 语 言 
L= {w :nd(w) = n(w)} 
并 且 证 明了 它 是 确定 型 的 ， 但 不 是 线性 的 。 另 一 方面 ， 语 言 
L= {arb"}U{a'b”} 


是 线性 的 ， 但 却 不 是 确定 型 的 。 这 表明 了 正则 语言 、 线 性 语言 、 确 定型 上 下 文 无 关 语言 和 非 


确定 型 上 下 文 无 关 语 言 之 间 具 有 如 图 11-5 所 示 的 关系 。 
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仍然 还 有 未 解决 的 问题 。 我 们 在 10.5 节 中 的 习题 8 中 引入 了 确定 型 线性 有 界 自 动机 的 概念 。 
我 们 自然 要 提出 与 其 他 自动 机 类 似 的 问题 : 非 确定 型 在 这 里 起 什么 作用 ? 不 幸 的 是 ， 还 没有 
一 个 简单 的 答案 。 到 目前 为 止 ， 由 确定 型 线性 有 界 自 动机 所 接受 的 语言 族 是 否 是 上 下 文 相关 
语言 族 的 真子 集 还 是 未 知 的 。 

总 结 : 我 们 现在 已 经 知道 了 几 个 语言 族 及 与 它们 相关 的 自动 机 之 间 的 关系 。 我 们 建立 了 
语言 层次 结构 ， 并 且 把 自动 机 按照 它们 的 接受 能 力 进行 了 分 类 。 图 灵机 具有 比 线性 有 界 自动 
机 更 强 的 能 力 。 而 这 两 者 都 具有 上 比 下 推 自动 机 更 强 的 能 力 。 在 这 个 层次 结构 中 ， 处 于 最 底层 
的 是 有 穷 接受 器 ， 它 是 我 们 研究 的 出 发 点 。 | 


习题 
1. 收集 本 书 中 能 够 说 明 图 11-4 中 所 示 的 子 集 关系 是 正确 的 例子 。 
2. 找 出 两 个 这 样 的 例子 (不 包含 例 11.3 中 的 语言 )， 语言 是 线性 的 ， 但 却 不 是 确定 型 上 下 文 无 


关 的 。 
3. 找 出 两 个 这 样 的 例子 〈 不 包含 例 11.3 中 的 语言 ): 语言 是 确定 型 上 下 文 无 关 的 ， 但 却 不 是 线 


性 的 。 





第 12 章 算法 计算 的 限制 


我 们 已 经 讨论 过 图 灵机 能 够 完成 什么 样 的 工作 ， 现 在 我 们 来 看 图 灵机 所 不 能 完成 的 工作 。 
虽然 图 灵 论 题 让 我 们 相信 图 灵机 的 计算 能 力 几 乎 没有 限制 ， 但 是 我 们 仍然 在 不 同 的 场合 提 到 
过 ， 对 于 一 些 特定 的 问题 不 存在 相应 的 解决 算法 。 现 在 我 们 把 这 个 问题 更 加 明确 地 表述 出 来 。 
其 中 的 一 些 结论 可 以 表述 得 非常 简单 ; 如 果 一 个 语言 是 非 递归 的 ， 那 么 根据 定义 可 知 不 存在 
与 该 语言 相应 的 成 员 判定 算法 。 但 这 还 不 是 问题 的 全 部 ， 因 为 非 递归 语言 几乎 设 有 什么 实际 
价值 。 而 问题 将 进一步 深入 。 例 如 ， 我 们 已 经 提出 (还 没有 证 明 )， 不 存在 能 判定 上 下 文 无 关 
文法 是 否 是 无 二 义 性 的 算法 。 这 个 问题 对 我 们 进行 程序 设计 语言 的 研究 还 是 有 着 很 重要 的 实 
际 意义 的 。 

我 们 首先 定义 可 判定 性 (decidability) 和 可 计算 性 (computability) 的 概念 ， 当 我 们 说 图 
灵机 所 不 能 完成 某 个 事情 时 ， 我 们 通过 这 些 概 念 来 明确 说 明 我 们 的 意思 。 然 后 ， 我 们 来 看 几 
个 这 种 类 型 的 经 典 问题 ， 这 其 中 包括 著名 的 图 灵机 停机 问题 。 在 图 灵机 停机 问题 之 后 是 一 系 
列 与 图 灵机 和 递归 可 枚 举 语言 相关 的 问题 。 在 这 之 后 ， 我 们 来 看 一 些 关 于 上 下 文 无 关 语言 的 
问题 。 不 幸 的 是 ， 这 里 我 们 会 发 现 一 些 没 有 相应 算法 的 重要 问题 。 


12.1 图 灵机 所 不 能 解决 的 问题 


机 械 计 算 能 力 是 有 限 的 一 这 一 论断 并 不 令 人 吃惊 。 直 观 上 看 ， 我 们 知道 很 多 模糊 玄妙 的 
问题 需要 特别 的 洞察 力 和 良好 的 推理 能 力 ， 而 这 些 已 经 超出 了 我 们 目前 能 够 构造 的 任何 计算 
机 、 甚 至 是 可 以 预见 的 将 来 计算 机 的 能 力 。 对 于 计算 机 科学 家 来 说 ， 更 有 趣 的 是 ， 确 实 有 一 
些 问 题 可 以 清晰 、 简 单 地 陈述 ， 而 且 很 可 能 有 相应 的 解决 算法 ， 但 是 却 被 认为 是 任何 计算 机 
都 不 能 解决 的 。 


12.1.1 可 计算 性 和 可 判定 性 


在 定义 9.4 中 ， 我 们 说 明了 对 于 一 个 函数 f， 如 果 存 在 一 个 图 灵机 ， 使 得 f 在 某 个 定义 域 上 
的 所 有 的 值 都 能 够 被 计算 出 来 ， 那 么 就 称 函 数 /在 这 个 定义 域 上 是 可 计算 的 。 如 果 不 存 在 这 样 
的 图 灵机 ,那么 则 称 函数 f 是 不 可 计算 的 。 如果 一 个 图 灵机 只 能 够 计算 定义 域 上 的 部 分 函数 值 ， 
仍然 不 能 称 f 是 可 计算 的 。 从 这 里 可 以 看 出 ， 若 我 们 想 将 一 个 函数 归 类 为 可 计算 的 或 不 可 计算 
的 ， 就 必须 清楚 函数 所 在 的 定义 域 是 什么 。 . 

我 们 在 这 里 关心 的 是 能 不 能 给 出 一 个 简单 的 判定 ， 来 判断 一 个 计算 的 结果 是 “是 ”还 是 
“ 否 ”"。 这 样 ， 我 们 可 以 说 一 个 问题 是 可 判定 的 (decidable) 还 是 不 可 判定 的 (undecidable)。 
通过 一 个 问题 ， 我 们 将 了 解 到 一 系列 相关 的 语句 ， 其 中 每 一 个 语句 或 者 是 真 或 者 是 假 。 例 如 ， 
我 们 考虑 “对 于 上 下 文 无 关 的 文法 G， 它 的 语言 L(G) 是 二 义 性 的 ”这 和 句 话 。 对 于 某 些 C， 这 名 
话 是 正确 的 ， 但 对 于 另外 一 些 文法 ， 它 就 是 错误 的 。 然 而 ， 很 明显 ， 对 于 这 名 话 的 判断 必须 
两 者 取 一 。 问 题 是 要 判定 对 于 任意 给 定 的 G， 语 名 是 否 成 立 。 在 这 里 ， 同 样 有 一 个 潜在 的 定义 
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域 ， 即 所 有 上 下 文 无 关 文法 的 集合 。 对 于 一 个 问题 ， 如 果 存 在 一 个 图 灵机 能 够 对 问题 的 定义 
域 中 的 每 个 取 值 都 能 够 给 出 正确 的 答案 ， 我 们 则 称 这 个 问题 是 可 判定 的 。 

当 我 们 下 可 判定 或 不 可 判定 的 结论 时 ， 我 们 必须 知道 问题 的 定义 域 ， 因 为 定义 域 直 接 影 
响 结果 。 问 题 可 能 在 某 个 定义 域 上 是 可 判定 的 ， 但 是 在 另外 一 个 定义 域 上 却 不 是 可 判定 的 。 
具体 到 问题 的 一 个 实例 ， 总 是 可 以 判定 的 ， 因 此 结果 要 么 是 “ 真 "， 要 么 是 “ 假 ”。 在 第 一 种 
情况 中 ， 总 是 回答 “ 真 ”的 图 灵机 ， 给 出 的 答案 是 正确 的 ; 而 在 第 二 种 情况 中 ， 总 是 回答 
“ 假 ” 的 图 灵机 是 适当 的 。 这 看 起 来 是 个 滑稽 的 回答 ， 但 是 它 强调 了 重点 。 我 们 不 知道 正确 的 
回答 是 什么 这 一 事实 ， 不 影响 图 灵机 能 给 出 正确 响应 的 本 质 。 


12.1.2 图 灵机 停机 问 是 


我 们 首先 从 一 些 具有 历史 意义 的 问题 开始 ， 同 时 以 这 些 问 题 作为 开发 后 面 结 论 的 起 点 ， 
其 中 最 著名 问题 是 图 灵机 停机 问题 (halting problem)。 简 单 地 说 ， 问 题 是 这 样 的 :给 定 一 个 
图 灵机 M 的 描述 和 输入 w; 当 图 灵机 AM 从 初始 格局 gow 出 发 执行 一 个 计算 时 ， 最 终 会 停机 吗 ? 
用 简略 的 形式 表达 ， 当 M 作 用 到 w 上 ， 或 者 说 〈(M，w) 是 停机 还 是 不 停机 。 问 题 的 定义 域 是 
所 有 图 灵机 和 所 有 w 的 集合 ， 即 我 们 要 找到 一 个 图 灵机 ， 对 给 定 的 任意 MM 和 w 的 描述 ， 它 都 可 
以 预测 用 于 w 的 M 计 算是 否 会 停机 。 

我 们 不 能 通过 模拟 M 在 w 上 的 处 理 过 程 ， 即 用 通用 图 灵机 执行 它 来 得 到 答案 ， 因 为 没有 计 
算 长 度 的 限制 。 如 果 MM 进 入 了 无 穷 循 环 ， 那 么 不 管 我 们 等 待 多 长 时 间 ， 我 们 都 不 能 确定 MM 是 否 
在 循环 中 。 这 可 能 只 是 -一 个 非常 长 的 计算 。 因 此 ， 我 们 需要 的 是 某 个 算法 。 这 个 算法 能 够 根 
据 图 灵机 MM 的 描述 和 输入 w 来 分 析 确 定 正确 答案 。 但 是 ， 正 如 我 们 所 表明 的 ， 这 样 的 算法 并 不 
存在 。 

为 了 后 续 讨 论 ， 对 停机 问题 的 含义 有 个 准确 的 概念 是 方便 的 。 为 此 ， 我 们 对 上 面 所 述 的 
内 容 给 出 一 个 具体 的 定义 。 

定义 12.1 邻 ww 是 描述 图 灵机 M = (Q, 克 ,T, 6,9qo, 口 ,站 的 符号 事 ， 令 ww 是 M 字 母 表 中 的 一 
个 符号 事 。 我 们 假设 将 ww 和 w 编 码 为 0 和 1 的 符号 串 ， 如 同 10.4 节 中 所 用 的 方法 。 将 停机 问题 的 
解决 方案 表示 为 一 个 图 灵机 及 ， 对 任意 的 wy 和 w， 如 果 妥 作用 到 w 上 会 停机 ， 则 图 灵机 态 执 行 
计算 

gowuwh- X19,X2 
如 果 MM 作 用 到 w 上 不 会 停机 ， 图 灵机 态 执 行 计算 
qowuwt y1qny2 


这 里 q, 和 gq, 都 是 甩 的 终 态 。 

定理 12.1 不 存在 满足 定义 12.1 的 图 灵机 采 。 因 此 ， 图 灵机 的 停机 问题 是 不 可 判定 的 。 
证 明 : 我 们 使 用 反 证 法 , 即 假设 存在 一 个 算法 ， 相 应 地 存在 某 个 能 够 解决 停机 问题 的 图 灵机 已 。 
的 输入 将 为 符号 串 wwyw， 要 求 图 灵机 太 对 给 定 的 任意 www， 不 管 回答 为 “是 ”"， 还 是 回答 为 
“ 否 ”"， 都 停机 。 我 们 通过 停止 时 候 的 终 态 ， 比 如 说 是 q, 还 是 q,， 来 判定 得 到 的 回答 内 容 。 这 
种 情形 可 以 用 块 图 来 描述 ， 如 图 12-1 所 示 。 图 示 表 明 : 如 果 1M 的 初 态 是 m， 输 入 是 ww， 那么 
它 最 终 会 停 在 状态 9, 或 9, 上 。 正 如 定义 12.1 中 所 要 求 的 ， 我 们 希望 BH 具有 这 样 的 行为 如果 当 
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M 作 用 于 w 时 停机 ， 那 么 


qowmawF yxX1q 2 


如 果 M 作 用 于 w 时 不 停机 ， 则 


qowuwF- ny19ny2 
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接 下 来 ,我 们 修改 的 行为 以 便 得 到 另 一 个 图 灵机 H'。H' 的 结构 如 图 12-2 所 示 。 通 过 在 图 

12-2 中 新 增加 的 状态 ， 我 们 要 表达 的 是 :状态 q, 与 新 状态 qs 和 gq。， 三 者 之 间 存 在 不 依赖 带 符号 

的 转换 ， 并 且 带 保持 不 变 。 这 种 方法 是 很 简单 的 。 通 过 对 比 H 和 HH'， 我 们 可 以 发 现 ， 如 果 瑟 到 

达 了 状态 q, 并 且 停 机 ， 那 么 在 H' 上 它 会 进入 一 个 无 穷 循 环 。 形 式 化 地 ，HH' 的 行为 可 以 表示 为 : 
如 果 M 作 用 于 w 上 时 停机 ， 那 么 


罕 
GowMWw 上 六 2 


如 果 M 作 用 于 w 上 时 不 停机 ， 则 
qowuaw py19ny2 
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我 们 从 玉 ' 出 发 构造 另外 一 个 图 灵机 五 。 这 个 新 的 图 灵机 用 ww 作为 输入 ， 并 把 输入 复制 一 
份 ， 终止 于 初 态 go， 之 后 ， 执 行 和 已 相同 的 动作 。 那 么 对 于 天 的 行为 可 以 表示 为 : 如 果 M 作 用 


到 ww 上 时 停机 ， 那 么 


家 * 
qowut qowuwaul i 


如 采 M 作 用 到 ww 上 时 不 停机 ， 则 


qowut -iqowawut jy19n)2 
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既然 广 是 图 灵机 ， 就 可 以 用 {0, 1}" 中 的 一 个 符号 串 来 描述 ， 比 如 说 竟 。 这 个 符号 串 除 了 能 
够 作为 入 的 描述 ， 还 可 以 作为 输入 符号 囊 。 此 时 ， 我 们 理所当然 地 会 问 : 如 果 将 产 作 用 
于 交 ， 会 出 现 什么 样 的 结果 。 用 户 标 识 M， 从 上 边 我 们 可 以 得 到 ， 如 果 户 作用 到 人 砂 上 时 停 
机 ， 那 么 

gowFE jm 
如 果 广 作用 到 多 上 时 不 停机 ， 则 

Gow By1gny2 

这 显然 是 无 意义 的 。 这 个 矛盾 告诉 我 们 ， 我 们 假设 的 图 灵机 如 是 不 存在 的 。 因 此 关于 停机 
问题 可 判定 性 的 假设 是 不 成 立 的 。 国 

有 人 可 能 会 对 定义 12.1 提 出 质疑 ， 因 为 为 了 证 明 停机 问题 ， 我 们 要 求 石 必须 在 非常 明确 的 
格局 下 开始 或 结束 。 但 是 ， 不 难 发 现 ， 这 种 任意 选 定 的 情况 在 证 明 过 程 中 仅仅 起 到 很 小 的 作 
用 ; 本 质 上 ， 同 样 的 推理 过 程 对 于 任何 其 他 的 开始 格局 和 终止 格局 都 适用 。 出 于 讨论 的 目的 ， 
我 们 已 经 把 问题 和 有 具体 的 定义 联系 到 了 一 起 ， 但 是 这 并 不 影响 结论 。 

记 住 定理 12.1 的 内 容 是 很 重要 的 。 定 理 12.1 并 不 排除 对 于 特定 的 情况 ， 停 机 问题 是 可 解 
的 。 通 常 ， 我 们 通过 对 M 和 w 的 分 析 可 以 给 出 图 灵机 是 否 停机 。 定 理 12.1 的 含义 是 : 并 不 是 
对 于 所 有 的 情况 都 能 够 给 出 那样 的 结论 ; 没有 一 种 算法 可 以 对 所 有 的 ww 和 w 都 能 给 出 正确 的 
判定 。 

支持 定理 12.1 的 论点 已 经 给 出 ， 它 们 是 经 典 的 并 且 有 历史 意义 。 该 定理 的 结论 实际 上 隐 含 
在 以 下 述 形式 出 现 的 先前 的 研究 成 果 中 。 

定理 12.2 。 如 果 停 机 问题 是 可 判定 的 ， 那 么 所 有 的 递归 可 枚 举 语言 都 将 是 递归 的 。 因 此 ， 
停机 问题 是 不 可 判定 的 。 

证 明 : 设 L 是 > 上 的 递归 可 枚 举 语言 ，M 是 接受 L 的 图 灵机 。 设 8 是 解决 停机 问题 的 图 灵机 ， 那 
么 对 于 停机 问题 ， 我 们 可 以 构造 如 下 的 步骤 : 

1. 将 BH 作 用 到 www 上 ， 如 果 瑟 返回 “ 否 ”， 则 根据 定义 可 知 w 不 在 L 中 。 

2. 如 果 右 返回 “是 ”， 就 将 MM 作用 到 w 上 。 而 M 是 一 定 会 停机 的 ， 所 以 M 会 最 终 告诉 我 们 w 
是 否 在 L 中 。 

这 样 就 为 L 构 造 了 一 个 成 员 资 格 判 定 算法 ， 使 得 L 成 为 了 递归 的 。 但 是 我 们 已 经 知道 有 些 
递归 可 枚 举 的 语言 不 是 递归 的 。 这 个 矛盾 表明 不 存在 ， 即 停机 问题 是 不 可 判定 的 。 图 

由 定理 11.5 可 知 停机 问题 和 递归 可 枚 举 语 言 的 成 员 资格 判定 问题 几乎 是 等 价 的 。 唯 一 的 不 
同 在 于 : 对 于 停机 问题 ， 我 们 不 区 分 终 态 停机 还 是 非 终 态 停机 ; 而 对 于 成 员 资格 判 定 问题 ， 
我 们 却 区 分 。 定 理 11.5 的 证 明 (通过 定理 11.3 证 明 的 ) 和 定理 12.1 的 证 明 是 密切 相关 的 ， 两 者 
都 是 对 角 线 化 的 一 个 版 本 。 


12.1.3 将 一 个 不 可 判定 问题 简化 成 另外 一 个 问题 


上 述 论证 通过 将 停机 问题 和 成 员 资格 判定 问题 关联 起 来 阐明 了 一 个 非常 重要 的 简化 技术 。 
如 果 问 题 4 的 可 判定 性 和 问题 8 的 可 判定 性 是 一 致 的 ， 那 么 我 们 说 问题 4 可 以 简化 (reduced) 
成 问题 8。 同 时 ， 如 果 我 们 知道 了 4 是 不 可 判定 的 ， 那 么 也 就 知道 了 8B 也 是 不 可 判定 的 。 我 们 
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将 通过 一 些 例子 来 说 明 这 一 点 。 

例 12.1 状态 进入 问题 (state-entry problem ): 给 定 任意 的 图 灵机 AM = (@8, 了 ,TT, 6, go, [DL, 了 ) 
和 任意 的 9EQ，wEZ*， 来 判定 当 MM 作 用 到 w 上 时 ， 会 不 会 进入 状态 9。 这 个 问题 是 不 可 判定 的 。 

为 了 将 停机 问题 简化 为 状态 进入 问题 , 我 们 首先 假设 有 一 个 算法 4 能 够 解决 状态 进入 问题 。 
那么 我 们 就 可 以 用 它 来 解决 停机 问题 。 例 如 ， 给 定 任 意 的 M 和 wm， 我 们 可 以 修改 M 来 得 到 敢 ， 
使 得 当 且 仅 当 M 停 机 时 ， 矿 进入 状态 4 并 且 停 机 。 通 过 M 的 转换 函数 65， 我 们 可 以 知道 实现 这 
样 的 修改 很 简单 。 如 果 M 停 机 ， 那 么 必然 存在 某 些 6(qi, a) 没有 定义 。 因 此 我 们 对 每 个 这 样 的 、 
没有 定义 的 6 进行 修改 ， 使 得 

6(g;, 9) = (9,a, R) 


这 里 g 为 终 态 。 这 样 就 得 到 了 让。 我们 将 状态 进入 算法 4 应 用 到 ( 应, gq, w) 上 。 如 果 4 回 答 
“是 ”， 那 么 就 进入 了 4 状态 ， 同 时 (M, w) 停机 。 如 果 A4 回 答 “ 否 ”"， 则 (M,w) 不 停机 。 

这 样 ， 状 态 进入 问题 是 可 判定 的 一 -这 一 假设 就 给 出 了 停机 问题 的 算法 。 因 为 停机 问题 是 
不 可 判定 的 ， 所 以 状态 进入 问题 也 一 定 是 不 可 判定 的 。 口 

例 12.2 空白 带 停机 问题 (blank-tape halting problem) 是 另外 一 个 可 以 通过 停机 问题 简 
化 来 得 到 的 问题 。 给 定 一 个 图 灵机 M， 如 果 从 空白 带 开始 ， 判 定 M 会 不 会 停机 。 这 个 问题 是 不 
可 判定 的 。 

为 了 表明 这 个 简化 是 如 何 得 到 的 ， 假 设 我 们 给 定 M 和 w， 首 先 利用 MM 构造 一 个 从 空白 带 开 
始 的 新 图 灵机 M,， 然 后 将 w 写 到 M,, 上， 同时 将 M, 置 于 格局 gw 上 。 之 后 ，M, 和 M 就 一 致 了 。 
显然 ，M, 在 空白 带 上 停机 当 且 仅 当 MM 在 w 上 停机 。 

假设 现在 空白 带 停机 问题 是 可 判定 的 。 对 于 任意 给 定 的 〈M, w)， 我 们 首先 构造 M,， 然 后 
对 它 应 用 空白 带 停机 的 算法。 结论 会 告诉 我 们 ， 当 1 作用 到 w 上 时 ，M 是 否 会 停机 。 由 于 对 于 
所 有 的 M 和 w， 这 个 假设 都 成 立 ,， 所 以 空白 带 停机 问题 的 算法 就 可 以 被 转换 成 停机 问题 的 算法 。 
又 由 于 后 者 是 不 可 判定 的 ， 所 以 空白 带 停 机 问题 也 同样 是 不 可 判定 的 。 口 

这 两 个 例子 证 明 过 程 中 的 构造 方法 展示 了 一 种 建立 不 可 确定 性 结论 的 通用 方法 。 块 图 通 
常 可 以 帮助 我 们 表示 这 个 过 程 。 图 12-3 解 释 了 例 12.2 中 的 构造 过 程 。 在 图 中 ， 我 们 首先 使 用 算 
法 将 (M, w) 转化 为 M,; 这 个 算法 显然 已 经 存在 了 。 接 下 来 ， 我 们 使 用 假定 存在 的 解决 空白 
带 停机 问题 的 算法 。 将 这 两 个 算法 结合 就 得 到 了 停机 问题 的 算法 。 但 停机 问题 的 算法 是 不 可 
能 存在 的 ， 因 此 我 们 得 出 4 是 不 存在 的 。 











图 12-3 停机 问题 的 算法 
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实际 上 ， 判 定 问题 是 值 域 为 {0, 1} 的 函数 ， 即 结果 是 一 个 是 或 否 的 回答 。 我 们 也 可 以 来 
看 一 些 更 一 般 性 的 函数 ， 看 它们 是 否 是 可 计算 的 。 为 此 ， 我 们 需要 根据 已 经 建立 起 来 的 方 
法 ， 将 停机 问题 (或 者 是 其 他 已 知 的 不 可 判定 的 问题 ) 简化 成 计算 问题 中 的 函数 的 问题 。 
根据 图 灵 论 题 ， 我 们 猜想 在 实际 环境 中 遇 到 的 函数 都 是 可 计算 的 ， 因 此 对 于 不 可 计算 的 函 
数 的 例子 ， 必 须 看 得 更 远 一 些 。 绝 大 多 数 不 可 计算 的 函数 的 例子 一 般 都 和 预测 的 图 灵机 行 
为 有 关 。 

例 12.3 ” 设 [ = {0, 1, 口 }。 定 义 一 个 函数 AD ， 它 的 值 是 所 有 #n 态 图 灵机 从 空白 带 开始 ， 
到 进入 停机 状态 所 进行 的 最 大 迁移 数 。 这 个 函数 是 不 可 计算 的 。 

在 我 们 说 明 这 一 点 之 前 ， 我 们 先 来 确认 /(n) 对 于 所 有 的 n 都 能 被 定义 。 首 先 ， 注 意 具 
有 个 状态 的 图 灵机 的 个 数 是 有 限 的 。 这 是 因为 C 和 T 了 都 是 有 限 的 ， 所 以 6 的 定义 域 和 值 域 也 
是 有 限 的 。 这 也 就 意味 着 不 同 的 5 的 个 数 也 是 有 限 的 ， 因 此 不 同 的 xn 态 图 灵机 的 个 数 也 是 有 
限 的 。 

在 所 有 的 " 态 图 灵机 中 ， 有 些 总 是 停止 的 。 例 如 ， 有 些 图 灵机 只 具有 终 态 ， 因 此 不 存在 迁 
移 。 而 有 些 " 态 图 灵机 从 空白 带 开始 永 不 会 停机 ， 但 是 它们 不 会 影响 到 /的 定义 。 所 有 能 够 售 
机 的 图 灵机 都 将 进行 确定 数目 的 迁移 ， 在 这 些 迁 移 数 中 ， 我 们 选取 最 大 值 赋 给 (mm)。 

取 任意 的 图 灵机 M 和 正 数 户 。 我 们 把 可 以 很 容易 地 将 1 修改 为 真 。 认 会 在 如 下 的 两 种 情 
况 下 停机 : 作用 到 空白 带 上 的 MM 停机 时 ， 迁 移 次 数 不 超 过 m 次 ; 或 者 作用 到 空白 带 上 的 M 进 行 
的 迁移 超过 了 m 次 。 我 们 所 要 做 的 就 是 用 M 对 迁移 次 数 进行 计数 ， 当 计数 超过 m 次 后 停止 计数 。 
假设 现在 f(n) 在 某 个 图 灵机 F 上 是 可 计算 的 。 我们 把 属 和 通过 图 12-4 所 示 的 方法 结合 在 一 起 。 
首先 计算 (QI)， 这 里 的 Q 是 M 的 状态 集 。 这 个 值 是 M 停 机 时 所 进行 的 迁移 次 数 的 最 大 值 。 我 
们 用 得 到 的 这 个 值 作为 m 来 构造 MY ， 而 覆 的 描述 用 于 构造 通用 图 灵机 M,。 这 个 M, 可 以 告诉 我 
们 当 M 作 用 于 空白 带 时 ，M 是 否 会 停机 或 者 在 少 于 /(|Q|) 次 内 不 停机 。 如 果 我 们 发 现 M 作 用 到 
空白 带 上 的 时 候 进行 了 超过 /(Q)) 次 的 迁移 ， 那 么 根据 /的 定义 ， 这 意味 着 M 永 远 不 会 停机 。 
这 样 ， 我 们 就 得 到 了 空白 带 停机 问题 的 解决 方案 ， 结 论 的 不 可 能 性 强迫 我 们 接受 事实 /是 不 可 
以 计算 的 。 口 






mm=eh 
F 








图 12-4 空白 带 停 机 问题 的 算法 
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习题 

. 详细 描述 怎样 将 定理 12.1 中 的 转化 为 HH'。 

假如 我 们 修改 定义 12.1， 按 照 M 作 用 到 w 上 是 否 会 停机 来 要 求 gowwwF gyw 或 者 qowww- 9sw。 重 

新 检查 定理 12.1 的 证 明 过 程 ， 证 明定 义 的 不 同 不 影响 定理 证 明 的 关键 过 程 。 

.证 明 下 面 的 问题 是 不 可 判定 的 。 给 定 任意 的 图 灵机 M, aET 且 wEz+， 判 断 当 M 作 用 到 w 上 的 

时 候 ， 是 否 会 写 出 符号 c。 大 

对 于 一 般 性 的 停机 问题 ， 我 们 要 求 针 对 任意 的 M 和 w 都 给 出 正确 的 算法 。 我 们 可 以 放宽 这 种 

一 般 性 ， 例 如 对 于 所 有 的 M 和 一 个 单独 的 w， 找 出 正确 的 算法 。 如 果 对 于 任意 的 w 都 存在 判 

定 (M, w) 是 否 停机 的 算法 ， 那 么 我 们 称 这 个 问题 是 可 以 判定 的 。 证 明 即 使 在 这 种 情况 下 ， 

问题 仍然 是 不 可 判定 的 。 

:证明 没有 算法 可 以 判定 是 否 一 个 任意 的 图 灵机 会 在 所 有 的 输入 上 停机 。 

. 我 们 来 看 这 个 问题 : “图 灵机 在 计算 过 程 中 会 再 次 访问 它 的 起 始 单元 ( 即 计算 开始 时 ， 读 写 
头 所 在 的 单元 ) 吗 ? ”这 是 一 个 可 判定 的 问题 吗 ? 

.证 明 没有 算法 可 以 判定 任意 两 个 图 灵机 M, 和 ,是否 会 接受 同样 的 语言。 各 

-如果 习 题 7 中 的 Ms 是 一 个 有 穷 自 动机 ， 那 么 结论 如 何 ? 

9. 停机 问题 对 于 确定 型 下 推 自动 机 是 否 是 可 解 的 ? 即 给 定 一 个 定义 7.2 中 的 pda， 我 们 是 否 能 
够 判定 对 于 输入 w， 自 动机 是 否 会 停机 ? 

10. 设 M 是 任意 的 图 灵机 ，x 和 y 是 它 的 两 个 可 能 的 瞬时 描述 。 证 明 沙 wy 是 否 成 立 是 不 可 判定 
的 。 物 

11. 在 例 12.3 中 ,给 出 A(1) 和 f(2) 的 值 。 

12. 证 明 … 个 图 灵机 是 否 会 在 任 一 输入 上 停机 是 不 可 判定 的 。 

13. 设 8 是 所 有 从 空白 带 开始 能 够 停机 的 所 有 图 灵机 的 集合 。 证 明 这 个 集合 是 递归 可 枚 举 的 ， 
但 是 却 不 是 递归 的 。 等 

14. 考虑 所 有 有 具有 带 字母 表 [ = {0, 1, 口 ) 的 n 态 图 灵机 构成 的 集合 。 给 出 具有 这 种 带 字母 表 的 
图 灵机 的 个 数 的 函数 m(n)。 

15. 设 T = {0, 1, 口 }， 且 b(n) 是 n 态 图 灵机 从 空白 带 开始 到 停机 时 所 检查 过 的 最 大 带 单元 个 数 。 
证 明 b(n) 是 不 可 计算 的 。 

16. 判断 下 面 的 结论 是 否 成 立 : 问题 的 定义 域 是 有 限 的 ， 任 何 一 个 这 样 的 问题 都 是 可 判定 
的 。 利 


12.2 递归 可 枚 举 语言 的 不 可 判定 问题 


我 们 已 经 确定 递归 可 枚 举 语言 不 存在 成 员 资格 判定 算法 。 对 于 递归 可 枚 举 语言 来 说 ， 在 
决定 一 些 属 性 的 时 候 缺 少 算法 不 是 异常 情况 ， 而 是 普遍 的 情况 。 正 如 我 们 所 看 到 的 ， 我 们 对 
这 类 语言 了 解 得 不 是 很 多 。 因 为 递归 可 枚 举 语言 具有 的 一 般 性 太 强 ， 所 以 我 们 提出 的 任何 关 
于 它 的 问题 基本 上 都 是 不 可 判定 的 。 同 样 ， 当 我 们 对 递归 可 枚 举 语言 提出 问题 的 时 候 ， 我 们 
发 现 能 够 通过 某 种 方法 将 停机 问题 简化 成 当前 问题 。 在 这 里 ， 我 们 给 出 几 个 例子 来 说 明 这 个 
过 程 ， 并 且 从 这 些 例 子 中 得 到 处 理 一 般 情况 的 提示 。 
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定理 12.3 设 G 是 无 限制 文法 。 那 么 L(G) = 好 是否 成 立 是 不 可 判定 的 。 
证 明 : 我 们 将 递归 可 枚 举 语言 的 成 员 资 格 判定 问题 简化 成 这 个 问题 。 假 设 给 定 了 图 灵机 M 和 
某 个 符号 串 w。 我 们 这 样 修改 M: M 首 先 用 其 带 上 某 个 特殊 部 分 保存 输入 。 然 后 ， 无 论 它 什么 
时 候 进 入 终 态 ， 它 都 会 检查 自己 保存 的 输入 ， 并 且 ， 当 且 仅 当 它 的 输入 是 w 的 时 候 ， 才 接受 。 
这 一 点 可 以 通过 修改 6 来 做 到 。 对 于 每 个 w 构 造 一 个 图 灵机 M, 满 足 


LM,) = LN{w} 


利用 定理 11.7， 我 们 可 以 构造 相应 的 文法 G,。 显 然 ， 从 M 和 w 得 到 G, 的 构造 总 能 够 被 完成 。 同 
样 ， 我 们 还 会 知道 L(G,) 不 为 空当 生 仅 当 wEL(M)。 

假设 现在 存在 算法 A 能 够 判定 L(G) = B 是 否 成 立 。 如 果 我 们 用 7 来 表示 产生 G, 的 算法 ， 那 
么 我 们 可 以 把 7 和 4 结合 在 一 起 , 如 图 12-5 所 示 那 样 。 图 12-5 表 示 了 一 个 图 灵机 ， 该 图 灵机 能 够 
针对 任意 的 WM 和 w 来 判定 w 是 否 属于 L(MD)。 如 果 这 样 的 图 灵机 存在 ， 那 么 我 们 就 会 有 一 个 递归 
可 枚 举 语言 的 成 员 资格 判定 算法 ， 这 和 前 面 建立 的 结论 是 矛盾 的 。 因 此 ， 我 们 得 出 问题 
Z(O = OB” 是 不 可 判定 的 。 者 







空 否 判定 
算法 A 





L(G,) 为 空 








图 12-5 成 员 资 格 判 定 算法 


定理 12.4 设 M 是 任意 的 图 灵机 。 那 么 问题 L(M) 是 否 是 有 限 的 一 一 是 不 可 判定 的 。 
证 明 : 考虑 停机 问题 (M, w)。 从 M 出 发 ， 我 们 能 够 按照 如 下 的 步骤 构造 另外 一 个 图 灵机 应。 
首先 ， 修改 M 的 停机 状态 ， 使 得 这 些 状态 在 族 中 为 终 态 ， 即 能 够 接受 任意 的 输入 。 其 次 ， 修 
改 M， 使 得 履 在 自己 的 带 上 首先 产生 w， 然 后 再 执行 和 M 一 样 的 计算 ， 这 其 中 利用 新 生成 的 w 
和 其 他 未 被 使 用 的 空间 。 换 句 话说， 即 在 产生 w 之 后 ， 放 所 有 的 迁移 都 和 M 在 初始 格局 为 qow 
的 情况 下 的 迁移 一 样 。 如 果 M 在 任意 格局 停机 ， 则 应 会 在 终 术 停机 。 

因此 ， 如 果 (M,w) 停机 ， 那 么 好 对 于 所 有 的 输入 都 会 进入 终 态 。 如 果 (M, w) 不 停机 ， 
那么 W 也 不 会 停机 ， 因 此 ， 没 有 接受 到 任何 语言 。 即 ， 应 或 者 接受 无 限 语言 2+ 或 者 接受 有 限 
语言 8。 

如 果 我 们 假设 存在 算法 4， 它 能 够 告诉 我 们 LCM) 是 否 是 有 限 的 ， 那 么 我 们 就 可 以 按照 图 
12-6 中 的 方法 ， 针 对 停机 问题 构造 算法 。 因 此 ， 不 存在 算法 能 够 判定 L(M) 是 否 是 有 限 的 。 国 

我 们 注意 到 ， 在 定理 12.4 的 证 明 中 ,问题 “L(M) 是 有 限 的 吗 ” 的 特定 性 质 是 非 实质 性 的 。 
改变 该 问题 的 性 质 不 会 对 论点 产生 有 意义 的 影响 。 
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IL(M) 有 限 


LM) 非 有 限 


不 停机 
停机 






图 12-6 


例 12.4 证 明 : 对 于 任意 的 图 灵机 M， 其 中 > = {a, b}， 问 题 “L(M) 包含 两 个 相同 长 度 的 
不 同 符号 串 ” 是 不 可 判定 的 。 

为 了 证 明 这 一 点 ， 我 们 使 用 定理 12.4 中 所 用 的 方法 。 只 要 好 没有 到 达 停机 格局 ， 它 都 
能 被 修改 来 接受 两 个 符号 串 a 和 b。 为 了 做 到 这 一 点 ,保存 初始 输入 ， 并 在 计算 结束 的 时 候 ， 
将 输入 与 5、2 进 行 比较 ，M 仅 接受 这 两 个 符号 种 。 因 此 ， 如 果 (M, w) 停机 ， 那 么 放 就 
接受 了 两 个 同样 长 度 的 符号 串 。 否 则 好 没有 接受 任何 符号 串 。 剩 下 的 证 明 过 程 与 定理 12.4 
相同 。 口 

用 同样 的 方法 ， 我 们 可 以 将 问题 替换 为 “L(M) 能 否 接受 长 度 为 5 的 符号 串 ” 或 “L(M) 是 
否 是 正则 的 "， 本 质 上 ， 这 样 并 不 影响 证 明 。 这 些 问 题 (及 与 其 类 似 的 问题 ) 都 是 不 可 判定 的 。 
对 于 这 些 问 题 ， 正 式 的 一 般 性 结论 是 Rice 定 理 。 定 理 说 递归 可 枚 举 语 言 的 所 有 的 非 平凡 性 质 
都 是 不 可 判定 的 。 这 里 “ 非 平凡 的 ”(nontrivial) 是 指 只 被 部 分 递归 可 枚 举 语言 具有 的 属性 。 
关于 Rice 定 理 的 准确 陈述 和 证 明 可 以 在 Hopcroft &Ullman(1979) 上 找到 。 


CD 
— 
OO 


习题 


. 详细 描述 定理 12.4 中 的 1 的 构造 过 程 。 

.证 明 在 本 节 最 后 提 到 的 两 个 问题 是 不 可 判定 的 ， 即 

(a) L(M) 能 否 接受 长 度 为 5 的 符号 串 ; 

(b) L(M) 是 否 是 正则 的 。 

设 MI 和 M, 是 任意 的 两 个 图 灵机 。 证 明 问 题 “ LM,)C LM,)” 是 不 可 判定 的 。 兆 

设 G 是 任意 的 无 限制 文法 。 那 么 是 否 存 在 算法 能 够 判定 L(G)* 是 否 是 递归 可 枚 举 的 ? 

如 果 G 是 任意 的 无 限制 文法 ， 那 么 是 否 存 在 算法 来 判定 L(G)=L(G)* 是 否 成 立 ? 

设 G, 是 任意 的 无 限制 文法 ，Gs 是 任意 的 正则 文法 。 证 明 问 题 L(CG)ML(G,) = 8B 是 不 可 判定 
的 。 短 

:证明 习 题 6 中 的 问题 对 于 任意 固定 的 G,， 只 要 L(G,) 不 为 空 ， 问 题 就 是 不 可 判定 的 。 

8. 对 于 一 个 无 限制 的 文法 G， 证 明 问 题 “L(G) =L(G)" 是 否 成 立 ” 是 不 可 判定 的 。(a) 用 Rice 定 
理 证 明 ; (b) 用 基本 原理 (first principles ) 证 明 。 笼 317 


12.3 波斯 特 对 应 问题 
停机 问题 的 不 可 判定 性 在 实际 问题 中 有 很 多 相关 的 结论 ， 特 别 是 在 上 下 文 无 关 语 言 领域 


一 


-J 
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中 。 但 是 在 很 多 情况 下 ， 直 接 利用 停机 问题 工作 是 很 困难 的 。 需 要 在 停机 问题 和 其 他 问题 之 
间 建 立 一 系列 的 中 间 结 果 来 弥补 两 者 之 间 的 差距 。 这 些 中 间 结 果 由 停机 问题 的 不 可 判定 性 产 
生 ， 但 是 更 加 接近 于 我 们 要 研究 的 问题 。 因 此 ， 这 些 中 间 结 果 能 够 使 得 问题 的 证 明 更 加 简单 。 
其 中 的 一 个 中 间 结 果 是 波斯 特 对 应 问题 (Post correspondence problem ) 。 
下 面 给 出 波斯 特 对 应 问题 的 定义 。 给 定 在 某 个 字母 表 Z 上 的 两 个 由 "个 字符 串 组 成 的 序列 ， 
和 = Wi w;, ,Ww, 


B= vi, VV 
对 于 (4,B) 对 ， 如 果 存 在 一 个 非 空 的 整数 序列 i,j, …,k， 满 足 
WiWj Wh = VV 
那么 我 们 称 (4, B) 对 存在 波斯 特 对 应 解 (Post correspondence solution, PC-solution ) 。 波 斯 
特 对 应 问题 就 是 要 找 出 一 种 算法 来 判定 对 于 任意 给 定 的 (4, 8) 对 ， 是否 存在 一 个 波斯 特 对 


应 解 。 
例 12.5 设 2 = {0,1}， 并 且 取 A 和 B 为 


wi= 11,w,= 100,w;= 111 
w=111,v,=001,v;,=11 


这 种 情况 存在 图 12-7 中 所 示 的 波斯 特 对 应 解 。 





如 果 我 们 取 


wi = 00,w, = 001, w; = 1000 
vi=0,v,=11,v;=011 


就 不 存在 波斯 特 对 应 解 了 。 因 为 由 元 素 A 组 成 的 任意 符号 串 都 要 比 相 应 的 由 元 素 8 组 成 的 符号 
串 长 。 口 

在 特定 的 例子 中 ， 我 们 可 以 通过 具体 的 构造 或 者 证 明 来 说 明 波斯 特 对 应 解 的 存在 与 否 。 
但 是 通常 ， 我 们 无 法 对 所 有 的 情况 给 出 一 般 性 的 解决 算法 。 所 以 波斯 特 对 应 问题 是 不 可 判 
定 的 。 

证 明 上 述 论 断 的 过 程 有 点 长 ， 为 了 清楚 起 见 ， 我 们 把 证 明 过 程 分 为 两 部 分 。 在 第 一 部 分 
中 ， 我 们 首先 介绍 修改 过 的 波斯 特 对 应 问题 (modified Post correspondence problem ) 。 如 果 存 
在 整数 序列 i, j, …, 上 ， 满 足 


WiwiWwj "We = ViViVj Ve 


那么 我 们 说 (4, B) 对 存在 修改 过 的 波斯 特 对 应 解 (modified Post correspondence solution, 
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MPC-solution ) 。 在 修改 过 的 波斯 特 对 应 问题 中 , 序列 4、B8 中 的 首 个 元 素 扮演 了 很 特别 的 角色 。 
一 个 修改 过 的 波斯 特 对 应 解 必 须 由 w 和 wii 开头 。 注 意 : 如 果 存 在 MPC-solution ， 那 么 必然 存在 
PC-solution ， 但 是 反之 则 不 成 立 。 

修改 过 的 波斯 特 对 应 问题 是 设计 算法 来 判定 任意 的 〈4, B) 对 是 否 存在 MPC-solution。 这 
个 问题 也 是 不 可 判定 的 。 我 们 通过 将 已 知 的 不 可 判定 问题 一 一 递归 可 枚 举 语 言 的 成 员 资格 判 
定 问 题 一 一 简化 成 修改 过 的 波斯 特 对 应 问题 来 证 明 其 不 可 判定 性 。 最 后 ， 我 们 介绍 如 下 构造 。 
假设 给 定 无 限制 文法 G = (V, 7, S, P) 和 一 个 目标 符号 串 w。 之 后 ， 我 们 按照 图 12-8 所 示 的 方法 
来 产生 (4, B) 对 。 在 图 12-8 中 ， 符 号 串 FS 一 被 作为 w ， 符 号 串 到 作为 站。 其 他 符号 串 的 顺序 
是 随意 的 。 














| 4 | 8 
Fs F F 是 不 在 VUT 中 的 符号 
a a 对 每 个 aET 
a A 对 每 个 VEV 
E 祖 碟 | E 是 木 在 VUT 中 的 符号 . 
x; 对 P 中 的 每 个 x 一 y 
: 
图 12-8 


我 们 最 终 断 言 wEL(G) 当 且 仅 当 用 这 种 方法 构造 的 集合 4 和 集合 B 具 有 MPC-solution。 由 于 
这 个 结论 不 是 显而易见 的 ， 所 以 我 们 通过 一 个 简单 的 例子 来 说 明 一 下 。 | 
例 12.6 设 G =({4,B,C}, {a,b,c},5,P)， 产生 式 是 
S—aABb|Bbb 
Bb—C 
AC—aac 
并 取 w = aaac。 按 照 给 定 方法 生成 的 和 B 的 序列 在 图 12-9 中 给 出 。L(G) 中 的 符号 串 w = aaac 
的 推导 过 程 如 下 : 


S—aABb=>aAC=>aaac 


在 图 12-10 中 ， 给 出 了 这 个 推导 的 过 程 ， 同 时 给 出 了 相应 的 MPC-solution， 这 里 给 出 了 推导 的 
前 两 步 。 推 导 符号 电 上 下 的 整数 分 别 展示 了 用 于 构造 符号 申 的 w 和 v 的 索引 。 


bP 
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[4 
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A 
8 
C 
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4 
Bb 
AC 
> 





图 12-10 


从 图 12-10 中 ， 我 们 仔细 观察 会 发 现 ， 如 果 要 构造 一 个 MPC-solution， 那 么 就 必须 从 wi 开 
始 ， 即 从 Fs 一 开始 。 这 个 符号 串 包 括 3， 因 此 为 了 匹配 它 ， 我 们 必须 使 用 wo 或 者 wm。 在 这 个 例 
子 中 , 我 们 使 用 了 vi。， 这 使 得 wio 被 引入 ，wio 的 引入 使 我 们 得 到 了 部 分 推导 中 的 第 二 个 符号 串 。 
再 多 看 几 步 ， 我 们 会 看 到 符号 种 ww 总 比 wymw 要 长 。 在 推导 过 程 中 ， 第 一 个 序列 总 是 领 
先 一 步 。 唯 一 的 例外 是 最 后 一 步 ，ws 使 得 v 组 成 的 符号 串 能 够 赶 上 来 。 图 12-11 显 示 了 完整 的 
MPC-solution。 构 造 的 过 程 和 例子 表明 了 下 一 个 结论 是 如 何 建立 的 。 口 


1 wio Wa Wy Ws Wy WI4 Wy 13 wo 





图 12-11 


定理 12.5 。” 设 G = (V, T, 5S, P) 是 任意 的 无 限制 文法 ，w 是 T+ 上 的 任意 符号 事 。 设 (4, B) 
是 由 G 构 造 的 相应 的 对 ，w 是 图 12-8 所 示 的 过 程 中 的 w。 那 么 (A, B) 对 中 存在 MPC-solution 当 
且 仅 当 wEL(G)。 
证 明 : 证 明 过 程 中 包含 了 形式 化 的 归纳 推理 。 我 们 这 里 省 咯 了 细节 。 田 
根据 这 个 结论 ， 我 们 可 以 从 递归 可 枚 举 语言 的 成 员 资格 判定 问题 推导 出 修改 过 的 波斯 特 
B35] 对 应 问题 ， 因 而 论证 了 后 者 的 不 可 判定 性 。 
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定理 12.6 修改 过 的 波斯 特 对 应 问题 是 不 可 判定 的 。 
证 明 : 给 定 任意 的 无 限制 文法 G = (Y, 7T, 9, P) 和 wE7T*， 我 们 按照 前 面 介绍 的 方法 来 构造 集合 4 
和 和 集合 B。 根 据 定理 12.5，(4, 8) 对 存在 MPC-solution 当 且 仅 当 wEL(G)。 

现在 我 们 假定 修改 过 的 波斯 特 对 应 问题 是 可 判定 的 。 我 们 可 以 根据 图 12-12 中 描述 的 过 程 
来 构造 G 的 成 员 资 格 判定 问题 的 算法 。 根 据 G 和 w 来 构造 4 和 B 的 算法 是 存在 的 ， 但 是 G 和 w 的 
成 员 资 格 判 定 算法 是 不 存在 的 。 因 此 ， 我 们 得 出 修改 过 的 波斯 特 对 应 问题 是 不 可 判定 的 。 曾 


AB MPC-solution 
n 图 12-8 所 示 | 
站 Mrc 法 | | 










无 MPC-solution 





图 12-12 成 员 资 格 判定 算法 


利用 上 述 的 工作 ， 我 们 可 以 证 明 原 有 形式 的 波斯 特 对 应 问题 。 
定理 12.7 波斯 特 对 应 问题 是 不 可 判定 的 。 
证 明 : 我 们 将 证 明 如果 波 斯 特 对 应 问题 是 可 判定 的 ， 那 么 修改 过 的 波斯 特 对 应 问题 也 是 可 判 
定 的 。 
我 们 假设 给 定 了 在 某 个 字母 表 > 上 的 符号 串 序 列 4 = wi, wa …,w 和 B = v1, v,,…, ys 然后， 
我 们 引入 新 符号 ¢ 和 $， 并 且 引 入 新 序列 C 和 D 的 定义 
C = yo0, 1, n+l 
D = zo, 《1 Cn 
对 于 i = 1,2,…,n 
yi = Wal wo wim¢ 
后 三 vn vag Var 
这 里 wj 和 vi 分 别 代表 了 w 和 v; 中 的 第 j 个 字母 ， 且 m; = |wil, ri 二 |vil。 即 y 是 由 在 w 的 每 个 字母 后 
加 上 ?得 到 的 ， 而 z 是 由 在 v 的 每 个 字母 前 加 上 # 得 到 的 。 为 了 完成 对 C 和 D 的 定义 ， 我 们 取 
yo 三 VYyi 
Jnr+l 三 § 
Z0 三 Z&1 
Zry1=&S 


现在 考虑 (C, D) 对 ,假设 它 存在 PC-solution。 由 于 #¢ 和 $ 的 位 置 ， 这 个 解 的 左边 必须 有 y。， 奢 
边 必须 有 y, ,'， 因 此 这 个 解 肯定 有 如 下 形式 : 


Clin =¢vigvi2 "gvng “gv:g§ 
不 考虑 字符 & 和 8$， 我 们 可 以 看 到 


wiwj Wh = VV Wh 
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因此 (4, B) 对 就 存在 MPC-solution。 

我 们 可 以 倒 过 来 证 明 如 果 (4, B) 对 存在 MPC-solution ， 那 么 〈C, D) 对 就 存在 PC- 
solution。 . . 
现在 假设 波斯 特 对 应 问题 是 可 判定 的 ， 我 们 按照 图 12-13 中 所 示 来 构造 机 器 。 机 器 显然 可 
以 判定 修改 过 的 波斯 特 对 应 问题 。 但 是 修改 过 的 波斯 特 对 应 问题 是 不 可 判定 的 ， 因 此 ， 就 不 
存在 判定 波斯 特 对 应 问题 的 算法 。 图 


MPC-solution 
无 MPC-solution 








无 PC-solution 






图 12-13 MPC 算 法 


习题 

. 设 4 = {001, 0011, 11, 101}，B = {01, 111, 111, 010}。 那 么 (4, 8) 对 是 否 存在 一 个 PC- 

solution? 是 否 存在 MPC-solution? 澳 

.给 出 定理 12.5 的 证 明细 节 。 | 

3. 证 明 对 于 | 区 | = 1， 波 斯 特 对 应 问题 是 可 判定 的 ， 即 对 于 任意 给 定 的 > 上 的 (4, B) 对 ， 存 在 

算法 能 够 判定 它 是 否 存在 一 个 PC-solution。 各 . 

.假设 我 们 限制 波斯 特 对 应 问题 的 定义 域 ， 使 得 它 的 字母 表 只 包含 两 个 符号 。 那 么 相应 的 结 

果 是 否 可 判定 ? 

.证 明 下 列 问题 是 不 可 判定 的 。 

(a) 如 果 存 在 整数 序列 满足 wiwj… ww = ViVj “Vevis 那么 存在 MPC-solution。 各 
(b) 如 果 存 在 整数 序列 满足 wiwzwawj…wi = wy， 那么 存在 MPC-solution。 

6. 我 们 称 给 定 的 4, B) 对 具有 偶数 个 PC-solution 当 且 仅 当 存在 一 个 非 空 的 偶数 个 整数 的 序列 
i,j,…,k， 满 足 wwj…w = www。 证 明 对 于 任意 (4, B) 对 是 否 存在 偶数 个 PC-solution 的 
判定 问题 是 不 可 判定 的 。 . 

12.4 上 下 文 无 关 语 言 的 不 可 判定 问题 

波斯 特 对 应 问题 是 学 习 i 下 文 无 关 语 言 的 不 可 判定 问题 的 有 力 工 具 。 我 们 将 通过 一 些 结 

论 来 说 明 这 一 点 。 

定理 12.8 不 存在 算法 能 够 判定 给 定 的 上 下 文 无 关 文 法 是 否 是 无 二 义 性 的 。 
证 明 : 给 定 某 个 字母 表 > 上 的 两 个 符号 串 序列 4 = (wi, w,,…,w,) 和 B = (vj, v,,…, v,)， 选 取 另 
外 一 组 符号 a1, a,, …, a, 构 成 新 的 集合 ， 满 足 
{ai, Q2, am = 


pe 


iD 


上 


un 


且 给 定 两 个 语言 


La= {ww wwiaar aai} 
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和 
La = {vv Vviaar “aa:} 
现在 来 看 上 下 文 无 关 文 法 
G = ({5, $4, $8}, ZU{ai, az ,an}, P, 5) 318 
这 里 产生 式 集合 P 是 两 个 子 集 的 并 : 第 一 个 集合 Ps 包括 
5 一 8 


SS 一 Wigaalwa， 其 中 [= 1,2,…,n 


第 二 个 集合 Ps 则 有 产生 式 
SS 
Se 一 ViSaalvwai， 其 中 i 三 1, 2， ”于 


现在 取 
Ca = ({5,$4}, ZUt{a, aa aa， Pa, $) 
Gap 三 ({5, Sp}, ZUt{a, GQ;, 的 an}, Ps, S) 
那么 ， 显然 
Ls = L(G,) 
Ls = L(Gs) 


而 且 L(G) = LaULs。 

很 容易 看 出 G4 和 Gs 自身 都 是 无 二 义 性 的 。 如 果 给 定 L(G) 中 一 个 以 ai 结尾 的 符号 串 ， 那 么 
它 在 G4 中 的 推导 必然 以 S54 开始 。 同 样 ， 我 们 能 够 知道 在 接 下 来 的 步骤 中 必须 使 用 哪个 产生 
式 规则 。 因 此 ， 如 果 说 G 是 二 义 性 的 ， 那 么 一 定 是 因为 存在 某 个 w 有 两 种 推导 形式 


S=>5s—>wiS a ww Wea a = Ww 
S—Sp=>vSgar sv Vd ad = Ww 


相应 地 ， 如 果 G 是 二 义 性 的 ， 那 么 (4, B) 对 的 波斯 特 对 应 问题 就 有 解 。 
如 果 存 在 能 够 解决 二 义 性 问题 的 算法 ， 那么 我 们 就 可 以 按照 图 12-14 将 它 修改 成 能 够 解决 波 
斯 特 对 应 问题 的 算法 。 但 是 波斯 特 对 应 问题 是 不 可 解 的 ， 因 此 二 义 性 问题 也 是 不 可 判定 的 。 国 


、 一 义 性 
和 < 


PC-solution 


No PC-solution 
G 是 无 二 义 性 的 





图 12-14 PC 算法 
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定理 12.9 对 于 任意 两 个 上 下 文 无 关 文 法 GI 和 G,， 不 存在 算法 能 够 判定 下 面 的 结论 是 否 
成 立 
L(G)NI(G,) = 8 


证 明 : 将 G, 和 Gs, 分别 视 为 定理 12.8 证 明 里 面 的 Gs 和 Gs。 假 设 L(G4) 和 L(Gs) 有 一 个 共有 的 元 
素 ， 即 
SA ww "Wear" da 


。 . 
Ss—>Vvivj "VA "aa 


那么 A, B) 对 就 有 了 一 个 PC-solution。 反 之 ， 如果 (4, B) 对 没有 一 个 PC-solution， 那 么 L(G4) 
和 L(Gs) 就 没有 一 个 共有 的 元 素 。 因 此 、 我 们 得 出 L(GJ)NL(Gs) 为 空当 且 仅 当 (4, B) 对 有 一 个 
PC-solution。 因 此 定理 得 证 。 国 

还 有 很 多 其 他 的 类 似 结论 。 其 中 一 些 可 以 被 简化 成 波斯 特 对 应 问题 ， 而 另 一 些 则 可 以 通 
过 先 建 立 不 同 的 中 间 结果 来 解决 ( 见 本 节 习 题 6 和 习题 7) 。 在 这 里 我 们 不 给 出 证 明 。 

有 很 多 与 上 下 文 无 关 语言 相关 联 的 不 可 判定 问题 ， 这 一 点 表面 上 看 起 来 让 人 有 些 吃惊 ， 
它 表明 在 这 个 领域 中 ， 一 些 我 们 希望 建立 算法 的 问题 是 受 计算 限制 的 。 例 如 ， 如 果 我 们 能 够 
知道 用 BNF 定 义 的 程序 设计 语言 是 否 是 二 义 性 的 ， 或 者 知道 两 个 用 不 同 规范 定义 的 语言 实际 
上 是 否 是 等 价 的 ， 都 将 会 对 我 们 有 所 帮助 。 但 是 ， 已 知 的 结论 告诉 我 们 ， 这 是 不 可 能 的 ， 因 
此 为 这 两 个 问题 寻找 算法 是 在 浪费 时 间 。 然 而 ， 一 定 要 记得 对 于 特定 的 问题 、 甚 至 有 可 能 是 
最 有 意思 的 那些 问题 ， 解 决 的 方法 可 能 是 存在 的 。 不 可 判定 性 结论 告诉 我 们 的 是 没有 完全 通 
用 的 算法 ， 不 管 一 个 方法 能 够 处 理 多 少 不 同 的 情况 ， 总 有 不 能 处 理 的 情况 。 


习题 


1. 证 明定 理 12.8 中 的 G4 和 Gs 自身 都 是 无 二 义 性 的 。 

友 2. 证 明 : 对 于 上 下 文 无 关 文 法 G, 和 G, 来 说 ，L(G,)C Z(G,) 是 否 成 立 是 不 可 判定 的 。 

友 3. 证 明 : 对 于 任意 的 上 下 文 无 关 文法 G, 和 G:， 问 题 “L(GJ)mL(G;) 是 否 是 上 下 文 无 关 的 ”是 
不 可 判定 的 。 

次 4. 证明: 如 果 定 理 12.8 中 的 LGJNL(Gs) 是 正则 的 ， 那 么 它 肯定 是 空 的 。 并 用 这 个 结论 来 证 
明 : 对 于 上 下 文 无 关 G 来 说 ， 问 题 “L(G) 是 正则 的 ”是 不 可 判定 的 。 

友 5. 设 志 是 正则 语言 ，G 是 上 下 文 无 关 文法 。 证 明 问 题 “ 志 ELG) ”是 不 可 判定 的 。 ， 

去 6. 设 M 是 任意 的 图 灵机 。 不 失 一 般 性 地 ， 我 们 可 以 假设 每 个 计算 都 包含 有 偶数 个 迁移 。 对 
于 每 个 这 样 的 计算 


qowt- x x x 
我 们 都 可 以 构造 符号 串 
gowF- xt- xo xs- x, 


这 个 计算 被 称 为 是 有 效 计算 (valid computation )。 
证 明 对 于 每 个 MM， 我 们 都 可 以 构造 三 个 上 下 文 无关 的 文法 G,、G; 和 G;， 满 足 : 
(a) 所 有 有 效 计算 的 集合 是 L(GDL(G,); 





滔 法 计算 办 限制 227 
(b) 所 有 无 效 计算 的 集合 ( 即 有 效 计算 集合 的 补 ) 是 ZGC3)。 

友 7 利用 上 面 习题 中 的 结论 来 证 明 : 在 所 有 上 下 文 无 关 文 法 G 的 定义 域 上 ,，“L(G) = 5” 是 不 
可 判定 的 。 

友 8 设 C 是 上 下 文 无 关 文法 ，G: 是 正则 文法 。 那 么 LOGU)mZL(G;) = 纪 是 否 是 可 判定 的 ? 


让 9 设 C, 和 G: 是 文法 ， 其 中 G 是 正则 文法 ， 那 么 对 于 下 列 情况 ， 问 题 L(G,) = L(G,) 是 否 是 可 
判定 的 ? 


(a) G: 是 无 限制 的 
(b) G, 是 上 下 文 无 关 的 
(c) G, 是 正则 的 
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第 13 章 ”其 他 的 计算 模型 


虽然 图 灵机 是 我 们 所 构造 的 最 一 般 的 计算 模型 ， 但 是 它们 不 是 仅 有 的 模型 。 在 不 同时 期 ， 
提出 了 很 多 其 他 模型 ， 其 中 一 些 模 型 乍 看 起 来 和 图 灵机 有 着 很 大 的 不 同 。 然 而 ， 最 终 发 现 所 
有 的 这 些 模型 都 是 等 价 的 。 这 个 领域 中 的 很 多 开创 性 的 工作 是 在 1930 年 到 1940 年 之 间 由 一 些 
数学 家 完成 的 ， 其 中 包括 了 著名 的 A. M. Turing。 他 们 创立 的 结论 不 仅 使 机 械 计算 概念 变 得 更 
加 清晰 ， 而 且 使 整个 数学 理论 都 变 得 更 加 清晰 了 。 

Turing 的 工作 成 果 发 表 于 1936 年 ， 而 当时 还 没有 任何 商用 计算 机 。 事 实 上 ， 他 的 全 部 思想 
都 是 独立 于 计算 机 之 外 的 。 虽然 Turing 的 思想 最 终 在 计算 机 科学 领域 中 变 得 非常 重要 ， 但 是 
他 最 初 的 目标 并 不 是 要 为 数字 计算 机 的 研究 提供 一 个 基础 。 为 了 理解 Turing 的 意图 ， 我 们 必 
须 简 单 地 看 一 下 当时 数学 界 的 状态 。 

随 着 牛顿 和 莱 布 尼 茨 在 17 世 纪 和 18 世 纪 发 现 了 微分 和 积分 ， 人 们 对 于 数学 的 研究 产生 了 
极 大 的 兴趣 ， 使 得 整个 学 科 以 爆炸 性 的 速度 发 展 。 产 生 了 很 多 不 同 的 研究 领域 ， 并 且 在 大 多 
数 领域 中 都 取得 了 显著 的 进展 。 在 19 世 纪 末 ， 数 学 学 科 的 体系 已 经 非常 庞大 。 数 学 家 也 开始 
成 熟 起 来 ， 他 们 发 现 一 些 逻 辑 问题 需要 用 更 加 仔细 的 方法 来 处 理 。 这 就 需要 更 加 严谨 的 推理 ， 
因而 引发 了 对 于 数学 基础 知识 的 检验 。 来 看 看 为 什么 这 种 检验 是 必需 的 。 在 很 多 数学 方面 的 
书籍 和 论文 中 ， 我 们 常会 碰 到 如 下 的 典型 情况 : 作者 做 了 一 些 似乎 正确 的 论述 ， 其 中 间 有 
“显而易见 ”和 “由 此 可 得 ”之 类 的 词语 。 在 数学 推理 中 ， 这 样 的 词语 是 很 常见 的 ， 它 们 表达 
的 意思 是 : 如 果 对 由 此 得 出 的 结论 有 质疑 ， 则 可 以 做 进一步 的 推理 。 当 然 ， 这 么 做 是 很 危险 
的 ， 因 为 这 样 容易 遗漏 问题 ， 导 致 我 们 引入 了 隐 含 有 错误 的 假设 ,或 者 做 出 了 不 正确 的 推论 。 
每 当 我 们 看 到 这 样 的 论证 时 ， 都 不 可 避免 地 会 质疑 证 明 过 程 的 正确 性 。 通 常 没有 有 效 的 办 法 
(用 来 检验 论证 的 正确 性 )， 因 此 ， 那 些 又 长 又 复杂 的 证 明 要 在 公布 后 ， 经 历 相当 长 的 时 间 ， 
才能 发 现 它们 的 错误 。 然 而 由 于 实际 限制 ， 这 种 类 型 的 推理 被 大 部 分 数学 家 所 接受 。 这 种 推 
理 能 够 将 问题 解释 清楚 ， 至 少 增加 了 我 们 对 结论 正确 性 的 信心 。 但 是 从 可 靠 性 的 角度 出 发 ， 
这 些 论证 是 不 可 以 接受 的 。 

相对 于 这 种 “宽松 ”的 数学 证 明 ， 另 外 一 种 方法 就 是 尽 可 能 地 形式 化 。 我 们 从 一 组 称 为 
公理 (axioms ) 的 假设 和 一 组 准确 定义 的 逻辑 推理 、 推 论 规 则 开始 。 顺 序 使 用 这 些 规则 ， 其 
中 每 一 个 规则 都 可 以 使 我 们 由 一 个 已 证 事实 得 到 另外 一 个 事实 。 这 些 规则 必须 满足 : 它们 的 
正确 性 可 以 用 常规 的 、 完 全 机 械 化 的 方法 检验 。 对 于 一 个 命题 ， 如 果 我 们 从 公理 出 发 ， 可 以 
用 有 限 的 逻辑 步骤 推导 出 这 个 命题 ， 那 么 我 们 认为 这 个 命题 被 证 实 是 正确 的 。 如 果 一 个 命题 
与 另外 一 个 正确 的 命题 相 矛 盾 ， 那 么 这 个 命题 是 错误 的 。 

寻找 这 样 的 一 个 形式 化 系统 是 19 世 纪 末 数 学 家 的 主要 目标 。 对 于 这 个 系统 ， 有 两 个 值得 
关注 的 地 方 。 首 先 ， 系 统 应 该 是 一 致 的 【consistent)。 即 不 能 有 这 样 的 命题 : 经 过 一 系列 的 步 
又 证 明 是 正确 的 ， 但 是 在 另外 一 个 有 效 的 证 明 下 是 错误 的 。 一 致 性 在 数学 中 是 不 可 或 缺 的 ， 
从 不 一 致 系统 中 推导 得 到 的 所 有 命题 都 是 不 被 承认 的 。 其 次 ， 系 统 应 该 是 完备 的 (complete ) 。 


| 
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这 章 味 着 系统 中 任意 可 表达 的 命题 都 能 够 被 证 明 是 正确 的 还 是 错误 的 。 曾 有 一 段 时 间 ， 人 们 
希望 这 种 一 致 而 完备 的 系统 能 够 开启 严格 而 完整 的 数学 证 明之 门 。 但 是 这 种 希望 却 因 K. 
G6del 的 工作 而 破灭 了 。 在 他 著名 的 不 完备 性 定理 (Incompleteness Theorem) 中 ，G6del 证 明 
了 任何 有 意义 的 一 致 系统 必定 是 不 完备 的 ， 即 必然 有 些 不 能 被 证 明 的 命题 。G6dei 的 革命 性 结 
论 发 表 于 1931 年 。 

G6del 的 工作 并 没有 回答 不 可 被 证 明 的 问题 是 否 可 以 通过 某 种 方式 与 其 他 可 以 证 明 的 问题 
区 别 开 来 。 因 此 ， 数 学 家 们 仍然 有 希望 能 够 对 大 部 分 数学 问题 给 出 精确 而 且 可 以 验证 的 证 明 
过 程 。Turing 和 当时 其 他 的 一 些 数学 家 ， 特 别 是 A. Church、S. C. Kleene 和 E. Post， 对 这 个 问 
题 进行 了 深入 的 研究 。 为 了 研究 这 个 问题 ， 数 学 家 们 建立 了 很 多 的 计算 模型 。 在 这 些 模 型 中 ， 
比较 著名 的 是 Church 与 Kleene 的 递归 函数 和 “(Post 的) 波斯 特 系统 (Post system) ， 当 然 还 有 
很 多 其 他 值得 研究 的 系统 。 在 本 章 中 ， 我 们 简要 回顾 一 下 围绕 着 这 些 研究 提出 的 一 些 观点 。 
在 这 里 我 们 只 能 给 出 一 些 极其 简单 的 描述 ， 读 者 需要 从 其 他 的 参考 文献 中 获得 具体 的 细节 。 
关于 递归 函数 (Recursive function ) 和 波斯 特 系 统 可 以 参考 Denning, Dennis, and Qualitz 
(1978)。 而 在 Salomaa (1973) 和 Salomaa (1985) 中 ， 有 很 好 的 关于 各 种 其 他 重 写 系统 
(rewriting system ) 的 讨论 。 

我 们 在 这 里 介绍 的 计算 模型 和 其 他 的 一 些 模型 有 着 不 同 的 起 源 。 但 是 最 终 发 现 它们 在 执 
行 计 算 的 能 力 上 都 是 等 同 的 。 这 些 结论 最 初 源 于 立 奇 论题 (Church's thesis )。 这 个 论题 表明 
所 有 可 能 的 计算 模型 ， 如 果 它 们 足够 宽广 ， 那 么 必然 是 等 同 的 。 这 也 隐 含 着 ， 对 于 模型 来 说 ， 
总 是 会 有 各 种 各 样 的 限制 ， 使 得 某 个 函数 不 能 很 好 地 表述 。 这 个 论题 和 图 灵机 论题 十 分 接近 ， 
将 它们 组 合 在 一 起 称 为 堪 末 -图 灵 论 题 (Church-Turing thesis)。 它 提出 了 关于 算法 计算 的 一 
个 基本 的 原则 (不 可 证 明 的 )， 同 时 ， 它 为 不 可 能 存在 更 强 计算 模型 这 一 理论 提供 了 强 有 力 的 
证 据 。 


13.1 递归 函数 


函数 是 数学 中 很 基础 的 概念 。 正 如 在 1.1 节 中 总 结 的 ， 函 数 中 有 一 个 被 称 为 定义 域 的 集合 
和 一 个 被 称 为 值 域 的 集合 ， 函 数 是 将 定义 域 中 的 一 个 元 素 映 射 到 值 域 上 一 个 元 素 的 规则 。 它 
的 概念 是 很 宽泛 的 ， 因 此 ， 如 何 表示 这 种 规则 随 之 产生 。 有 很 多 种 方法 可 以 定义 函数 。 有 些 
被 经 常 使 用 ， 而 另 一 些 则 不 然 。 

我 们 对 如 ftn) = r+ 1 的 函数 表示 方法 已 经 很 熟悉 了 。 它 将 任意 的 参数 x 和 自身 相 乘 ， 然 后 
再 加 一 。 函 数 的 定义 很 明确 ，、 我 们 可 以 用 完全 机 械 化 的 方式 来 计算 函数 值 。 但 是 ， 为 了 完善 f 
的 定义 ， 我 们 还 必须 说 明 它 的 定义 域 。 例 如 对 于 这 个 函数 ， 我 们 可 以 把 它 的 定义 域 定义 为 所 
有 整数 的 集合 ， 那 么 相应 的 值 域 就 是 正 整数 集合 的 一 些 子 集 。 

既然 我 们 可 以 用 这 种 方法 来 表示 很 复杂 的 函数 ， 那 么 我 们 就 想 知道 这 种 表达 形式 是 否 具 
有 一 般 性 。 对 于 一 个 定义 好 的 函数 ( 即 ， 我 们 知道 函数 的 定义 域 元 素 和 值 域 元 素 之 间 的 关系 )， 
是 否 能 够 用 这 种 函数 形式 表示 ?为 了 回答 这 个 问题 ， 我 们 首先 必须 明确 什么 样 的 形式 可 以 被 
接受 。 为 此 ， 我 们 首先 引入 一 些 基本 的 函数 ， 然 后 再 给 出 一 些 规则 ， 使 得 它们 能 够 构造 出 更 
复杂 的 函数 。 
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13.1.1 原始 递归 函数 

为 简单 起 见 ， 我 们 只 考虑 有 一 个 或 者 两 个 变量 的 国 数 。 国 数 的 定义 域 或 者 是 非 负 整 数 集 
合 ! 或 者 是 1x 7， 国 数 的 值 域 属 于 7。 在 这 些 设 定 下 ， 我 们 来 看 几 个 基本 国 数 : 


1. 堆 函数 (zero function) z(x) =0， 其 中 所 有 的 xE7。 
2. 后 继 函 数 (successor function) s(x)， 函 数 的 值 是 与 x 相 邻 的 下 一 个 正 整数 ， 即 使 用 常规 


表示 法 为 5(X) =x+1。 
3. 投影 函数 (projector function ) 


Pi(X1, X2) = Xk (这 里 k= 1， 2) 
基于 上 述 基 本 函数 ， 我 们 介绍 两 种 构造 较 复杂 函数 的 方法 : 
1. 组 合 (composition)， 即 通过 如 下 方法 构造 函数 ， 这 里 g1,、g8; 和 h 都 是 函数 。 
f(x,y) = h(g1(x, y), 82(x, y)) 
2. 原始 递归 ( Primitive recursion)， 这 里 通过 如 下 方法 递归 地 定义 函数 ， 这 里 9,/、g, 和 h 都 
是 函数 。 
flx, 0) = g1(7) 
f(x,y+ 1) = h(g,(x, y), f(x, y)) 
我 们 将 通过 一 些 例子 来 说 明 如 何 使 用 上 述 的 基本 函数 和 构造 方法 。 
例 13.1 整数 x 与 y 的 和 可 以 由 函数 add(x, y) 来 实现 ， 这 个 函数 可 以 递归 地 定义 为 
add(x, 0) =x 
add(x, y+ 1) = add(x,y)+1 
为 了 得 到 3 加 2 的 结果 ， 我 们 可 以 递归 地 使 用 这 些 规则 : 


add(3, 2) = add(3, 1)+1 
= (add(3,0) + 1)+1 
=(3+1)+1 
=4+1=5 口 


例 13.2 利用 例 13.1 中 定义 的 add 函 数 ， 我 们 可 以 定义 乘法 为 
mult(x, 0)= 0 
mult(x, y + 1) = add(x, mult(x, y)) 


形式 化 地 ， 第 二 步 是 原始 递归 的 应 用 ， 这 里 的 add 相 当 于 h， 而 gs(x, y) 是 投影 函数 p(x, y)。 口 
例 13.3 减法 不 是 特别 明显 。 考 虑 到 我 们 的 系统 中 不 允许 有 负数 ， 所 以 我 们 必须 首先 定义 
减法 。 通 过 普通 的 减法 来 定义 (系统 允许 的 ) 减法 
X~y=x-y， 当 x2y 了 时 
x 一 y=0， 当 x<y 时 


我 们 有 时 也 把 > 称 为 真 碱 (monus)， 通 过 它 定义 的 减法 的 值 域 是 7。 327 
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现在 定义 前 驱 (predecessor) 函数 
pred(0) =0 
pred(y + 1)=y 


通过 它 ， 可 以 这 样 定义 减法 
subtr(x, 0)= x 
Subtr(x, y + 1) = pred(subtr(x, y)) 
为 了 证 明 5 - 3 = 2， 我 们 通过 重复 使 用 定义 来 简化 命题 以 求证 
subtr(5, 3) = pred(subitr(5, 2)) 

= pred(pred(subtr(5, 1))) 

= pred(pred(pred(subtr(5, 0)))) 

= pred(pred(pred(S))) 

= pred(pred(4)) 

= pred(3) 

=2 口 


同样 ， 我 们 可 以 定义 整数 的 除法 ， 但 是 我 们 把 它 作 为 一 个 习题 。 如 果 我 们 接受 上 述 内 容 ， 
那么 我 们 会 发 现 所 有 基本 的 算术 运算 都 可 以 通过 上 面 描述 的 基本 过 程 来 构造 。 通 过 准确 定义 
的 代数 运算 ， 可 以 构造 其 他 的 更 为 复杂 的 运算 ， 十 分 复杂 的 运算 也 可 以 通过 简单 运算 来 构造 。 
我 们 把 可 以 通过 这 种 方式 构造 的 函数 称 为 原始 递归 的 。 | 

定义 13.1 ”一 个 函数 可 以 被 称 为 原始 递归 的 〈primitive recursive)， 当 且 仅 当 它 可 以 由 基 
本 函数 z,s,P 通 过 组 合 和 原始 递归 来 得 到 。 

注意 : 如 果 g,，g8s 和 h 都 是 全 函数 ， 那 么 通过 它们 定义 得 到 的 f 也 是 全 函数 。 由 此 可 知 每 一 
个 定义 在 7 和 /7 x I 上 的 原始 递归 函数 都 是 全 函数 。 

原始 递归 函数 的 表达 能 力 是 很 强 的 。 大 多 数 常 见 函 数 都 是 原始 递归 的 。 但 是 ， 并 非 所 有 
的 函数 都 属于 这 种 类 型 。 

定理 13.1 用 天 来 表示 所 有 从 1 到 1 的 函数 构成 的 全 合 。 那 么 在 严 中 有 些 函 数 不 是 原始 递归 的 。 
证 明 : 每 个 原始 递归 函数 都 可 以 通过 有 限 的 符号 串 来 表示 它 是 如 何 定义 的 。 可 以 将 这 些 符 号 
串 编码 并 按 标 准 顺 序 排列 。 因 此 ， 所 有 的 原始 递归 函数 都 是 可 数 的 。 

现在 假设 所 有 函数 构成 的 集合 也 是 可 数 的 ， 那 么 我 们 可 以 按照 菜 种 顺序 将 所 有 的 函数 列 
举 出 来 ， 比 如 说 ，f,, … 接 下 来 ， 我 们 构造 函数 8 并 定义 为 


gD)=f(D)+1,i=1,2,. 


显然 ，g 是 符合 函数 定义 的 ， 因 此 应 该 在 F 中 。 但 同样 明显 的 是 gz 和 每 个 /在 对 角 线 的 位 置 上 不 
同 。 这 个 矛盾 表明 F 是 不 可 数 的 。 

将 上 面 的 两 个 结论 和 在 -起 ， 我 们 证 明了 F 中 必然 存在 某 个 函数 不 是 原始 递归 的 。 国 

事实 上 ， 这 个 定理 可 以 进一步 扩展 : 不 仅 有 些 函 数 不 是 原始 递归 的 ， 而 且 有 些 实际 可 算 
函数 也 不 是 原始 递归 的 。 

定理 13.2 用 C 来 表示 所 有 从 /到 /的 可 算 函 数 集合 。 那 么 在 C 中 有 些 画 数 不 是 原始 递归 的 。 





pH 


证 明 : 通过 上 一 个 定理 的 证 明 ， 我 们 已 经 知道 所 有 原始 递归 函数 构成 的 集合 是 可 数 的 。 我 们 
把 这 个 集合 中 的 函数 表示 为 r1,r;, … 并 且 定 义 一 个 函数 g 
8(D) =r(D) +1 

通过 构造 ， 我 们 可 以 看 到 g 和 每 一 个 ,都 是 不 同 的 ， 因 此 g 不 是 原始 递归 的 。 但 是 显然 8 是 可 计 
算 的 。 因 此 定理 得 证 。 国 

在 对 角 理论 中 ,证 明 有 些 可 算 函 数 不 是 原始 递归 的 一 这 种 非 构 造 证 明 是 相当 简单 的 练习 。 
因为 这 种 函数 的 实际 构造 是 一 件 很 复杂 的 事情 。 在 这 里 ， 我 们 还 会 给 出 一 个 看 起 来 十 分 简单 
的 例子 ,但 是 关于 它 不 是 原始 递归 的 证 明 却 是 相当 长 的 。 329 


13.1.2 Ackermann 函 数 


Ackermann 国 数 是 一 个 从 7 x 1 到 1 上 的 函数 ， 定 义 如 下 : - 


A(0,y)=y+1 
A(x, 0) = A(x— 1,1) 
Alx,y+ 1)=A(x-1,A(x,y)) 


很 难看 出 这 里 的 函数 4 是 -个 完全 的 、 可 计算 的 函数 。 事 实 上 ， 我 们 可 以 很 容易 地 写 出 这 个 函 
数 计算 的 递归 的 计算 机 程序 。 然 而 ， 尽 管 表面 上 看 起 来 简单 ， 但 是 ，Ackermann 函 数 却 不 是 
原始 递归 的 。 

当然 ， 我 们 无 法 直接 从 4 的 定义 来 推导 出 来 。 尽 管 我 们 在 这 里 给 出 的 4 的 定义 并 不 是 一 个 
原始 递归 函数 的 形式 ,但 是 很 可 能 存在 另外 一 个 合适 的 形式 。 这 里 的 情形 类 似 于 我 们 前 面 遇 
到 的 : 证 明 一 个 语言 不 是 正则 的 或 者 不 是 上 下 文 无 关 的 。 我 们 需要 从 所 有 原始 递归 函数 的 类 
里 面 提取 一 些 共 有 的 属性 ， 来 表明 Ackermann 函 数 是 不 满足 这 些 属性 的 。 对 于 原始 递归 函数 
来 说 ， 它 们 的 一 个 属性 就 是 增长 率 。 随 着 i->%w， 原 始 递 归 函 数 的 增长 速度 会 出 现 一 个 极限 ， 
而 Ackermann 国 数 则 违反 了 这 个 限制 。 很 容易 证 明 : Ackermann 函 数 增长 得 十 分 迅速 。 这 个 在 
习题 9 至 习题 11 中 会 看 到 。 而 关于 原始 递归 函数 的 增长 速度 的 限制 , 将 由 下 面 的 定理 准确 给 出 。 
它 的 证 明 比 较 元 长 而 且 专 业 化 ， 所 以 这 里 被 省 略 了 。 

定理 13.3 设 / 是 任意 的 原始 递归 坊 数 。 那 么 必然 存在 某 个 整数 nx， 对 于 所 有 的 i = n,n + 1 … 
满足 


f(D <Aln, i) 


证 明 : 证 明 的 细节 可 以 参考 Denning, Dennis, and Qualitz (1978, p.534)。 嘲 
如 果 我 们 接受 这 个 结论 ， 那 么 很 容易 证 明 Ackermann 函 数 不 是 原始 递归 的 。 
定理 13.4 Ackermann 函 数 不 是 原始 递归 的 。 
证 明 : 考虑 国 数 
8(i) = Ai, i) EE 
如 果 A 是 原始 递归 的 ， 那 么 g 也 是 。 此 外 ， 根 据 定理 13.3， 必 然 存 在 某 个 4+， 对 于 所 有 的 i， 满 足 


8(D) < Aln, i) 
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现在 如 果 我 们 取 i = n， 那 么 我 们 得 到 了 蔬 盾 
8(n) = A(n, n) 
<A(ln,n) 


这 样 就 证 明了 Ackermann 函 数 不 是 原始 递归 的 。 国 


13.1.3 /地 归 函 数 

为 了 扩展 递归 函数 的 思想 使 其 包含 Ackermann 函 数 和 其 他 可 计算 函数 ， 我 们 必须 向 规则 中 
添加 一 些 内 容 ， 使 修改 后 的 规则 能 够 构造 这 样 的 (递归 ) 函数 。 其 中 的 一 个 方法 就 是 引入 4 或 
者 是 最 小 化 (minimalization ) 运算 符 ， 定 义 为 

Ly(g(x, 3》)) = 满足 g(x,y) = 0 的 最 小 y 

在 这 个 定义 中 ， 我 们 假设 8 是 全 函数 。 

例 13.4 设 函 数 

8(X,y) =X+y—3 
这 是 一 个 全 函数 。 如 果 x < 3， 那么 
y=3—x 

是 最 小 化 的 结果 。 如 果 x> 3， 那 么 就 没有 (yE7) 能 满足 rz+ y-3= 0。 因 此 


Uy(g(x,y)) = 3—x (x&3) 
= 无 定义 (x>3) 


我 们 可 以 从 这 里 看 到 即使 8(x, y) 是 一 个 全 函数 ，uy(g(x,y)) 也 可 能 只 是 部 分 定义 的 。 口 

如 上 例 所 示 ， 最 小 化 运算 符 使 得 递归 地 定义 部 分 函数 成 为 可 能 。 但 是 结果 表明 它 也 增强 
了 定义 全 函数 的 能 力 ( 能 够 定义 所 有 可 计算 函数 了 )。 这 里 ， 我 们 同样 只 给 出 主要 的 结论 和 如 
何 得 到 详细 证 明 的 参考 文献 。 

定义 13.2 如 果 一 个 函数 的 构造 可 以 通过 使 用 HU 运算 待 、 组 合 运 算 及 原始 递归 运算 来 完成 ， 
那么 我 们 称 这 个 函数 是 LU 递归 的 。 

定理 13.5 一 个 函数 是 1 递归 的 当 且 仅 当 它 是 可 计算 的 。 
证 骨 证 明细 节 请 参考 Denning, Dennis, and Qualitz (1978, Chapter 13)。 国 

4 递归 的 函数 因此 给 出 了 另外 一 个 计算 模型 。 


习题 
1. 使 用 例 13.1 和 例 13.2 中 的 定义 来 证 明 3 + 4 =7 和 2 x 3 = 6。 
2. 定义 函数 

Breater(x,y)=1 x>y 


=0 xe&y 


证 明 这 个 函数 是 原始 递归 的 。 泛 
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3. 定义 函数 
equals(x,y)=1 x=y 
~=0 Xx+zy 
证 明 这 个 函数 是 原始 递归 的 。 
4. 定义 函数 为 
f(x,y)=x xy? 
=0 x=y 
证 明 f 是 原始 递归 的 。 
次 5. 整数 除法 可 以 通过 两 个 函数 div 和 rem 来 定义 : 
div(x, y) =n 


这 里 的 "是 满足 xz > ny 的 最 大 整数 。 而 


rem(x,y) =xX—ny 


证 明 div 和 rem 都 是 原始 递归 的 。 
6. 证明 尔 数 An) = 2" 是 原始 递归 的 。 
7. 证 明 函 数 g(x,y) = 是 原始 递归 的 。 涡 
8. 编写 一 个 计算 Ackermann 函 数 的 计算 机 程序 ， 并 用 它 来 计算 4(2, 5) 和 4(3, 3)。 
9. 证 明 Ackermann 函 数 的 下 列 结论 成 立 。 
(a) A(1,y)=y+2 秘 
(b) 4(2,y)=2y+3 竹 
(c) A(3,y) =2+3—3 
10. 利用 习题 9 来 计算 4(4, 1) 和 A(4, 2)。 
11. 给 出 4(4, y) 的 一 个 一 般 表 达 式 。 
12. 给 出 4(5, 2) 的 递归 调用 步骤 。 
13. 证 明 Ackermann 国 数 是 一 个 定义 在 7x 7 上 的 全 国 数 。 
14. 利用 习题 8 中 的 构造 程序 来 计算 4(5, 5)。 能 解释 你 所 观察 到 的 过 程 吗 ? 
15. 对 于 下 面 的 每 个 8s， 计 算 uy(g(x, y))， 并 确定 它 的 定义 域 。 
(a) 8(X,y) = 2 
(b) g(x,y)=2°+y-3® 
(c) g(x,y) = (x 一 1)/Qy + 1) 的 整数 部 分 
(d) g(x,y) =x mod (y+ 1) 
16. 在 例 13.3 里 面 定义 的 pred 函 数 ， 虽 然 看 起 来 很 清楚 ， 但 是 它 却 没有 严格 遵循 原始 递归 函数 
的 定义 。 请 重新 定义 这 个 函数 ， 使 其 具有 正确 的 形式 。 


13.2 波斯 特 系统 


波斯 特 系统 看 起 来 很 像 无 限制 文法 ， 它 包含 了 一 个 字母 表 和 几 个 产生 式 规则 ， 通 过 这 些 
可 以 推导 出 连续 的 符号 串 。 但 是 波斯 特 系统 和 无 限制 文法 在 产生 式 的 使 用 上 有 很 大 的 区 别 。 


Ww 
[2 
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定义 13.3 波斯 特 系统 [可 以 定义 为 
T=(C, VYV, A,P) 

这 里 

C 是 一 个 由 常量 构成 的 有 限 集 合 ， 这 个 集合 又 包含 了 两 个 不 相交 的 集合 Cw 和 Ci，Cw 称 为 
非 终 结 常量 (nonterminal constants )，C7 称 为 终结 常量 (terminal constants) ; 

V 是 一 个 变量 的 有 限 集 ; 

A 是 一 个 从 C 得 到 的 有 限 集 ， 称 为 公理 ; 

已 是 一 个 产生 式 的 有 限 集 。 

波斯 特 系统 中 的 产生 式 必须 满足 一 些 特定 的 限制 。 它 们 必须 有 如 下 形式 

MT (13-1) 
这 里 %, y/EC ，V, WEV， 而 且 要 求 任何 变量 最 多 能 在 产生 式 的 左 部 出 现 一 次 ， 所 以 
Vi Vi(iz)) 


而 所 有 在 右 部 出 现 的 变量 必须 也 在 左 部 出 现 ， 即 


UweUv 
i=] 


假设 我 们 有 一 个 终结 符 的 符号 串 形 如 xjwix2w… wx ,1， 这 里 , 子 串 xi, Xx,… 还 配 了 式 (13-1) 
里 面 的 相应 字符 串 ，wEC 。 我 们 可 以 使 w = Vi, w; = 网 , …， 然 后 用 这 些 值 替换 式 (13-1) 右 
边 的 W。 既 然 每 个 W 都 有 相应 的 V; (在 左 部 )， 并 且 都 有 一 个 唯一 的 值 ， 那 么 我 们 可 以 得 到 新 的 
符号 串 yjwy2wj…y, ;1。 我 们 可 以 将 过 程 写 成 
XW LUM2W2 Xn YW Ym + 1 
现在 波斯 特 系 统 可 以 被 视 为 一 个 文法 了 ， 我 们 来 看 一 下 由 波斯 特 系统 得 到 的 语言 。 
定义 13.4 由 波斯 特 系 统 II = (C, V,4, P) 生成 的 语言 是 ZL(IT) = {fwEC7r: wo 人 mw, woEA} 
例 13.5 给 定 波斯 特 系统 
Cr= {a,b} 
Cy=@ 
V= {VV} 
A= {A} 


和 产生 式 
Vi>aVib 
这 个 系统 允许 如 下 推导 
A—ab=aabb 


第 一 步 ， 我 们 使 用 式 (13-1 ) ， 让 xi = 入 ， Vi=A,x,= A, y=a, Wi = Vi, y= 6b。 在 第 二 步 ， 我 们 
重 定义 Vi = ab， 其 他 保持 不 变 。 如 果 继 续 推导 下 去 ， 你 很 快 就 会 发 现 这 个 特殊 的 波斯 特 系统 
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上 自 成 的 语言 是 {a"b" : n> 0}。 口 
例 13.6 对 于 波斯 特 系统 
C7 = {1, +, =} 
Cy=$ 
V = {V, V, V3} 


A={1+1=11} 


和 产生 式 
Vi+V= VVl+V,= Vl 
VitV= VV + Vl= Vl 


那么 这 个 系统 允许 如 下 推导 


1+1=11=>1ll+1=111 
—>11l+11=1111 


如 果 我 们 把 这 里 面 由 1 组 成 的 符号 串 解释 为 整数 的 一 元 表示 ， 那 么 推导 可 以 写成 
1+1=2=2+1=3=2+2=4 


这 个 波斯 特 系 统 生成 的 语言 是 所 有 整数 加 法 的 等 式 集合 ， 如 : 2 + 2 = 4， 这 些 等 式 都 是 从 公理 
1+ 1= 2 得 到 的 。 加 | 

例 13.6 展 示 了 波斯 特 系统 可 以 通过 公理 的 集合 来 进行 严格 的 数学 证 明 。 这 也 是 设计 波斯 特 
系统 的 意图 。 同 时 ， 例 13.6 也 展示 了 如 此 严密 的 方式 的 根本 性 缺陷 和 为 什么 它 得 不 到 广泛 的 
使 用 。 虽 然 波斯 特 系统 对 于 证 明 复 杂 定 理 来 说 有 些 繁琐 ,但 却 是 通用 的 计算 模型 ， 像 下 面 的 
定理 表述 的 那样 。 

定理 13.6 一 个 语言 是 递归 可 枚 举 的 ， 当 且 仅 当 存 在 能 够 产生 它 的 波斯 特 系 统 。 
证 明 :; 证 明 过 程 相对 简单 ， 因 此 ， 我 们 在 这 里 只 做 简要 描述 。 首 先 ， 因 为 波斯 特 系统 的 推导 
过 程 是 完全 机 械 的 ， 所 以 可 以 在 图 灵机 上 来 实现 这 一 过 程 。 因 此 ， 任 何 由 波斯 特 系统 生成 的 
语言 都 是 递归 可 枚 举 的 。 

反 过 来 ， 记 住 : 任何 递归 可 枚 举 语言 都 可 以 由 某 个 无 限制 文法 G 生 成 ， 产 生 式 都 具有 如 下 
形式 : 


XYy 


这 里 x, yE(VUT)'。 给 定 任意 的 无 限制 文法 G, 我 们 可 以 得 到 一 个 波斯 特 系统 I = (Vn, C, 4, Pn)， 
这 里 Vn = {Vi, V3}, Cn = V, Cr = T, A = {5}。 对 于 文法 中 的 每 个 产生 式 x 一 y， 构 造 波 斯 特 系统 
中 的 产生 式 为 : 

VixV,— VyV, 
接 下 来 要 证 明 -一 个 w 能 够 被 波斯 特 系 统 生 成 ， 当 且 仅 当 它 属于 由 G 生 成 的 语言 ， 这 个 证 明 就 简 
单 了 。 国 


个 





ww 
-~ 
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习题 


.对 于 > = {a,b,c}， 构 造 一 个 波斯 特 系统 ， 使 之 能 够 生成 下 列 语言 。 

(a) L(a'b + ab’c) 

(b) L = {ww} 各 

(c) L = {a"b"c"} 

2. 构造 一 个 波斯 特 系统 ， 使 之 能 够 产生 L = {ww : wE{a, b}'}。 

.对 于 一 个 波斯 特 系 统 ， 如 果 2 = {a}， 公 理 为 {a}， 并 且 具 有 产生 式 Vi 一 ViV1|， 那 么 它 最 终生 
成 的 是 什么 语言 ? 葡 

如 果 习 题 3 中 的 公理 集合 为 {a, ap}， 那 么 这 个 波斯 特 系 统 生成 的 是 什么 样 的 语言 ? 
构造 一 个 波斯 特 系统 能 够 证 明 整 数 乘法 的 等 式 ， 从 公理 1 x 1 = 1 开始 。 世 

给 出 定理 13.6 的 证 明细 节 。 

对 于 具有 产生 式 


一 


上 


2 Om 上 


VaVV 


和 公理 集合 {ab} 的 波斯 特 系统 能 够 生成 什么 样 的 语言 ? 

.一 个 严格 的 波斯 特 系统 是 这 样 定 义 的 : 系统 中 的 每 个 产生 式 xy 除了 满足 通常 的 要 求 之 外 ， 
还 要 满足 出 现在 产生 式 两 边 的 变量 的 数目 是 相同 的 ， 即 式 (13-1) 中 的 n = m。 证 明 对 于 每 
个 由 波斯 特 系 统 生成 的 语言 7， 存在 某 个 严格 的 波斯 特 系 统 也 能 够 生成 L。 


13.3 重 写 系 统 


我 们 学 过 的 各 种 文法 与 波斯 特 系统 有 着 很 多 相同 之 处 : 它们 都 是 基于 某 个 字母 表 的 ， 都 
能 够 从 一 个 符号 串 得 到 另外 一 个 符号 串 。 即 使 是 图 灵机 也 可 以 归 人 此 类 ， 因 为 它 的 瞬时 描述 
也 是 一 个 能 够 完全 定义 其 格局 的 符号 串 。 而 程序 则 是 由 一 个 符号 串 得 到 另外 一 个 符号 串 的 一 
组 规则 。 我们 观察 到 的 这 些 结果 能 够 被 形式 化 地 表示 为 重 写 系统 (rewriting system)。 一 般 来 
说 ， 一 个 重 写 系 统 包 含 了 一 个 字母 表 2 和 一 个 产生 式 的 集合 。 产 生 式 能 够 将 2+ 中 的 一 个 符号 
串 转 换 为 另外 “个 符号 串 。 -个 重 写 系 统 与 另外 -个 重 写 系统 的 区 别 在 于 字母 表 的 种 类 和 产 
生 式 应 用 的 限制 。 

这 个 概念 很 宽泛 ， 除 了 我 们 以 前 碰 到 的 各 种 情况 以 外 ， 还 有 很 多 特殊 情况 都 能 被 轨 入 到 
这 类 系统 中 。 这 里 我 们 简要 地 介绍 一 些 不 太 为 人 所 知 但 却 比 较 有 趣 的 内 容 ， 同 时 提供 通用 的 
计算 模型 。 具 体 的 内 容 请 参考 Salomaa (1973) 和 Salomaa (1985)。 


Oo 


13.3.1 和 抢 阵 文法 


矩阵 文法 (matrix grammars) 与 我 们 以 前 学 习 过 的 文法 (也 被 称 为 短语 结构 文法 (phrase- 
structure grammars)) 不 同 ， 它 们 主要 的 区 别 在 于 对 产生 式 的 使 用 上 。 对 于 矩阵 文法 ， 它 的 产 
生 式 集合 包含 了 一 系列 的 子 集 P1, P,, …, P,， 其 中 每 一 个 子 集 都 是 一 个 有 序 的 序列 


XY Xa YY 


每 当 某 个 集合 P 中 的 第 一 个 产生 式 被 使 用 的 时 候 ， 我 们 必须 对 刚刚 产生 的 符号 串 使 用 第 二 个 





产生 式 ， 接 下 来 是 第 三 个 ， 依 此 类 推 。 如 果 我 们 要 使 用 集合 已 中 的 第 一 个 产生 式 ， 那 么 整个 
集合 中 的 产生 式 都 必须 能 够 同样 被 使 用 。 否 则 ， 就 不 能 使 用 集合 Pi 中 的 第 一 个 产生 式 。 
例 13.7 给 定 和 矩阵 文法 
Pi:S—55, 
P,: Si—asl, SbS,c 
P,: SA, S.A 


我 们 能 够 得 出 如 下 推导 : 
S=S1$,—>asSibS,c—aaSibbScc=—aabbcc 
注意 ， 每 当 我 们 使 用 集合 P; 中 的 第 一 个 产生 式 规则 来 得 到 a 时 ， 都 必须 同时 使 用 集合 中 的 第 二 
个 产生 式 规则 ， 产 生 相 应 的 和 c。 这 使 得 我 们 可 以 很 容易 地 看 出 由 这 个 矩阵 文法 生成 的 终结 
符 串 的 集合 是 
L= {a'b'c":n20} 口 
矩阵 文法 包含 了 短语 结构 文法 ， 可 以 将 短语 结构 文法 视 为 矩阵 文法 中 每 个 集合 P 都 只 包含 
一 个 产生 式 的 特殊 情况 。 同 样 ， 由 于 矩阵 文法 表示 了 运算 过 程 ， 所 以 它们 也 受制 于 丘 奇 论题 。 
我 们 从 这 里 得 出 矩阵 文法 和 短语 结构 文法 作为 计算 模型 具有 同样 的 表达 能 力 。 但 是 ， 如 例 
13.7 所 示 ， 有 了 时 使 用 矩阵 文法 给 出 的 解决 方案 要 比 用 不 受 限 的 短语 结构 文法 得 到 的 简单 很 多 。 


13.3.2 马尔 科 夫 算法 


马尔 科 夫 算法 (markov algorithm) 是 一 个 重 写 系 统 ， 它 的 产生 式 x->y 是 有 顺序 的 。 在 一 
个 推导 过 程 中 ， 第 一 个 可 使 用 的 产生 式 必 须 被 使 用 。 而 且 ， 在 最 左边 出 现 的 子 串 x* 必 须 被 替换 
为 ?。 有 些 产 生 式 可 以 被 单独 提出 来 作为 终结 产生 式 (terminal production )， 将 它们 表示 为 
xy。 一 个 推导 从 某 个 符号 串 wEZ 开 始 并 继续 ， 直 到 使 用 了 终结 产生 式 或 者 没有 可 以 使 用 的 
产生 式 为 止 。 

对 于 语言 接受 ， 集 合 TC 2 被 确定 为 终结 符 集合 。 从 终结 符 串 开始 ， 一 直 使 用 产生 式 直 到 
产生 了 空 串 。 

定义 13.5 设 M 是 一 个 具有 字母 表 并 上 和 终结 符 T 的 马尔 科 夫 算法 ， 那 么 它 接 受 的 语言 是 

L(M) = {wET : w >»A} 


例 13.8 考虑 具有 2 = 了 = {a,5} 的 马尔 科 夫 算法 ， 其 产生 式 为 


ab—A 
za 一 > 人 
在 推导 的 过 程 中 ， 每 一 步 都 会 消除 一 个 子 串 az 或 者 ba， 因此 
L(M) = {wE{a, by : ns(w) = ns,(w)} 口 


例 13.9 构造 一 个 马尔 科 夫 算法 接受 语言 L = {a"b" : n> 0}。 
答案 是 : 


339 





SC 
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GD 一 9 
asb—S 
9 一 .人 


在 这 个 例子 中 ， 如 果 我 们 取 前 两 个 产生 式 ， 颠 倒 它 们 的 左 部 和 右 部 ， 那 么 我 们 就 得 到 了 
-个 上 下 文 无 关 文 法 ， 它 能 生成 语言 L。 在 某 种 意义 上 , 马尔 科 夫 算法 是 简单 的 短语 结构 文法 。 
然而 我 们 还 不 能 随便 下 这 个 结论 ， 因 为 现在 我 们 还 不 知道 如 何 来 处 理 最 后 一 个 产生 式 。 但 是 ， 
这 个 观察 结果 的 确 为 我 们 提供 了 一 个 起 始点 一 一 证 明 下 面 描述 马尔 科 夫 能 力 的 定理 。 口 
定理 13.7 一 个 语言 是 递归 可 枚 举 的 当 且 仅 当 对 它 存 在 一 个 马尔 科 夫 算法 。 
证 明 : 请 参考 Salomaa (1985, p.35) 独 


13.3.3 上 系统 


LL 系统 (L-systems ) 的 起 源 比 较 出 平 我 们 的 意料 。 它 们 的 创始 人 A. Lindenmayer 使 用 它们 
来 对 特定 器 官 的 增长 模式 进行 建 模 。L 系 统 本 质 上 是 并 行 的 (parallel) 重 写 系统 。 根 据 这 一 点 ， 
我 们 知道 在 每 一 步 推 导 中 ， 每 个 符号 都 必须 被 重 写 。 因 此 ， 我 们 可 以 得 出 L 系 统 的 产生 式 必 须 
具有 如 下 形式 

a—>u (13-2) 


这 里 aEZ, uEZ 。 当 一 个 符号 串 被 重 写 的 时 候 ， 在 新 符号 串 产 生 之 前 ， 必 须 对 (符号 串 中 的 ) 
每 个 符号 都 应 用 一 个 这 样 的 产生 式 。 
例 13.10 设 > = {a} 且 4a->aa， 定 义 一 个 L 系 统 。 从 符号 串 a 开 始 ， 我 们 可 以 进行 这 样 的 推导 


a—>aa—aaaa=~—>dadaaaau 


这 样 推导 出 的 符号 串 集合 显然 是 
过 ={a2 :PP>z0O} 
注意 这 个 特定 的 重 写 系统 能 够 处 理 那些 用 短语 结构 文法 难以 解决 的 问题 。 口 


现在 我 们 已 经 知道 具有 类 似 于 式 (13-2) 形式 的 产生 式 的 L 系 统 不 足以 表示 所 有 的 算法 计 
算 。 我 们 可 以 对 它 进 行 扩充 来 保证 它 的 一 般 性 。 在 一 个 扩展 的 L 系 统 中 ， 产 生 式 具有 形式 


(x,a,y)—u 
这 里 的 aE3 日 r y, uEZ"， 基 中 a 仅 当 作为 符号 串 xay 的 一 部 分 的 时 候 ， 才 可 以 被 替换 为 4。 众 所 
周知 ， 这 个 扩展 的 L 系 统 是 通用 的 计算 模型 。 具 体 的 细节 请 参考 Salomaa (1985)。 
习题 
1. 为 L = {ww : wE{a,b 构造 矩阵 文法 。 毒 
2. 下面 的 矩阵 文革 能够 产生 什么 样 的 语言 ? 
Pi: S$->5,5, 


P,: SaSib, S$,—bS,a 
P; : 9 一 人 ,92 一 人 
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3. 假设 我 们 将 例 13.7 里 的 最 后 一 组 产生 式 修改 为 
P;: SI>A, 9 一 9 


那么 这 个 修改 后 的 矩阵 文法 能 够 产生 什么 样 的 语言 ? 
4. 为 什么 例 13.9 中 的 马尔 科 夫 算法 不 接受 abab? 
5. 找到 一 个 马尔 科 夫 算法 能 够 得 到 语言 L = {ab"c": n> 1}。 霹 
女 6. 构造 一 个 马尔 科 夫 算法 使 得 它 能 够 接受 L = {arb"a™ :n> 1,m>1}。 
7. 构造 一 个 系统 能 够 生成 L(aa’)。 
8. 当 具 有 如 下 产生 式 的 L 系 统 从 符号 串 a 开 始 推导 时 ， 能 够 得 到 一 个 什么 样 的 符号 捉 集 合 ? 萄 


a—>aa 


a—>aaa 


VD 


Ww 
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第 14 章 ”计算 复杂 性 介绍 


在 学 习 算法 和 计算 理论 的 时 候 ， 我 们 并 不 太 关 心 如 何 将 这 些 想法 应 用 到 具体 的 计算 机 上 。 
我 们 似乎 只 关心 对 于 特定 的 问题 ， 相 应 的 算法 存在 与 否 。 这 个 对 于 我 们 研究 理论 是 一 个 很 好 
的 起 点 ， 但 是 却 缺 乏 实 际 的 意义 。 对 于 实际 的 计算 ， 我 们 不 仅 需 要 知道 解决 问题 的 一 般 原 则 ， 
而 且 需 要 构造 具有 足够 效率 的 算法 。 我 们 称 可 以 被 有 效 解决 的 问题 为 可 解 的 (tractable)。 对 
于 这 个 概念 ， 我 们 将 在 本 章 中 给 出 一 个 更 加 详尽 的 定义 。 

在 软件 开发 的 实际 过 程 中 ， 效 率 涉 及 很 多 方面 。 有 时候， 我 们 关心 如 何 有 效 地 利用 计 
算 机 资源 ， 例 如 处 理 机 时 间 和 存储 空间 。 也 有 了 时候 ， 我 们 可 能 会 比较 关心 如 何 能 够 高 效 地 
开发 软件 ， 如 何 有 效 地 对 软件 进行 维护 ， 如 何 保证 它 是 可 靠 的 。 还 有 一 些 时 候 ， 我 们 比较 强 
调解 决 用 户 问题 的 效率 。 所 有 这 些 都 太 复杂 了 ， 不 能 通过 抽象 的 理论 来 描述 。 我 们 所 能 做 的 
就 是 集中 考虑 一 些 具体 的 问题 ， 并 由 这 些 问 题 抽 象 出 一 个 合适 的 框架 结构 。 大 多 数 已 建立 的 
结论 都 会 强调 空间 效率 和 时 间 效 率 ， 从 而 得 出 了 复杂 性 理论 (complexity theory) 这 个 重要 
主题 。 在 研究 复杂 性 时 ， 首 要 考虑 的 是 计算 效率 ， 它 是 通过 计算 在 时 间 和 空间 上 的 需求 来 衡 
量 的。 我 们 把 它们 分 别称 为 算法 的 时 间 复 杂 度 (time-complexity) 和 空间 复杂 度 (space- 
complexity ) 。 

计算 复杂 性 理论 的 范畴 很 宽泛 ， 其 中 大 部 分 都 超出 了 本 书 的 范畴 。 但 是 有 些 结论 可 以 被 
简单 地 表述 且 易 于 理解 ， 而 这 些 结论 又 进一步 地 揭示 了 语言 和 计算 的 本 质 。 在 本 节 中 ， 我 们 
给 出 复杂 性 理论 的 一 个 简要 概述 。 这 其 中 ， 大 部 分 结论 的 证 明 都 比较 难 ， 我 们 没有 提供 证 明 ， 

只 给 出 相应 的 参考 文献 。 我 们 在 这 里 只 是 给 出 这 个 领域 里 面 的 主要 研究 对 象 ， 并 且说 明 它 是 


怎么 和 我 们 知道 的 语言 及 自动 机 联系 起 来 的 。 由 此 ，、 我 们 在 主题 的 选择 和 讨论 的 正式 程度 上 . 


就 有 了 很 大 的 自由 。 
我 们 这 里 仅 限于 时 间 复杂 度 的 讨论 。 空 间 复 杂 度 与 它 有 着 类 似 的 结论 ， 但 是 时 间 复杂 度 
更 容易 理解 。 


14.1 计算 的 效率 


我 们 首先 从 一 个 具体 的 例子 开始 。 给 定 一 个 由 1000 个 整数 构成 的 表 ， 我 们 想 要 把 它们 按 
照 某 种 顺序 (比如 说 ， 升 序 ) 排列 起 来 。 排 序 问题 是 简单 的 ， 但 是 它 也 是 计算 机 领域 的 一 个 
非常 基础 性 的 问题 。 如 果 要 回答 “执行 排序 需要 多 长 时 间 ”， 那 么 我 们 就 需要 很 多 的 信息 。 很 
显然 ， 表 中 项 的 个 数 在 执行 时 间 的 长 短 上 起 着 很 重要 的 作用 ， 但 是 还 有 很 多 其 他 的 因素 。 这 
里 还 会 涉及 我 们 所 用 的 计算 机 和 执行 排序 的 程序 。 此 外 ， 有 车 于 种 排序 方法 ， 因 此 对 于 排序 
算法 的 选择 也 是 很 重要 的 。 其 实 ， 即 使 是 对 上 面 的 问题 进行 简单 的 估计 也 会 需要 考虑 很 多 的 
事情 。 如 果 我 们 要 对 排序 进行 一 个 大 致 的 描述 ， 那 么 我 们 就 不 得 不 忽略 大 多 数 的 细节 问题 ， 
而 集中 思考 那些 最 基础 的 问题 。 

对 于 计算 复杂 性 的 讨论 ， 我 们 需要 做 下 列 假设 来 简化 问题 : 
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1. 我 们 讨论 的 模型 将 是 图 灵机 。 具 体 采用 的 图 灵机 类 型 将 在 后 边 的 讨论 中 给 出 。 

2. 我 们 用 n 来 表示 问题 的 规模 。 对 于 我 们 排序 问题 显然，n 就 代表 了 表 中 项 的 个 数 。 
尽管 -个 问题 的 规模 不 一 定 总 能 这 么 容易 地 描述 ， 但 是 我 们 通常 可 以 把 它 映射 为 一 个 正 
整数 。 

3. 在 分 析 算法 的 时 候 ， 我 们 更 重视 它 在 一 般 情况 下 的 效率 ， 而 不 是 在 一 个 特定 情况 中 的 
效率 。 我 们 特别 关心 当 问题 的 规模 增 大 的 时 候 ， 算 法 效率 会 有 什么 变化 。 因 此 ， 主 要 的 问题 
就 是 当 n 增 大 的 时 候 ， 对 资源 需求 的 增长 有 多 快 。 

我 们 的 目标 是 把 问题 的 时 间 需 求 表 示 为 问题 规模 的 函数 。 在 这 里 ， 我 们 使 用 图 灵机 作为 
计算 模型 。 

首先 ， 我们 给 出 一些 关于 图 灵机 的 时 间 的 概念 。 我 们 认为 图 灵机 在 一 个 时 间 单 元 内 执行 
一 次 迁移 。 因 此 ， 一 个 计算 的 执行 时 间 就 是 图 灵机 的 迁移 次 数 。 正 如 前 面 所 述 ， 我 们 重点 考 
察 计算 需求 是 如 何 随 着 问题 规模 的 增 大 而 增长 的 。 一 般 来 说 ， 即 便 给 定 问题 规模 的 大 小 ， 问 
题 在 不 同情 况 下 的 增长 速度 也 是 不 同 的 。 我 们 在 这 里 只 关心 有 着 最 高 资源 要 求 的 最 坏 情况 。 
我 们 说 一 个 计算 的 时 间 复 杂 度 为 T(n)， 是 指 对 于 任意 规模 为 n 的 问题 ， 图 灵机 将 在 7(n) 次 迁移 
之 内 完成 计算 。 

在 制定 了 作为 计算 模型 的 具体 的 图 灵机 之 后 ， 我 们 可 以 写 出 具体 的 算法 ， 并 且 通 过 计算 
具体 的 执行 步 数 来 分 析 算 法 。 但 是 ， 由 于 各 种 各 样 的 原因 ， 这 种 方法 不 是 很 有 效 。 首 先 ， 具 
体 的 执行 步 数 会 随 着 程序 的 一 些 细节 而 变化 ， 因 此 ， 步 数 的 多 少 很 大 程度 上 取决 于 程序 员 
(编写 的 程序 )。 其 次 ， 从 实际 的 观点 出 发 ， 我 们 关心 的 是 算法 在 现实 世界 中 的 表现 ， 而 这 和 
它 在 图 灵机 上 的 表现 是 很 不 一 样 的 。 我 们 所 能 希望 的 最 好 的 情况 就 是 在 图 灵机 上 做 的 分 析 能 
够 体现 实际 特性 中 的 主要 方面 。 例 如 ， 理 论 分 析 能 够 给 出 实际 计算 的 时 间 复 杂 度 的 渐进 增长 
速率 。 因 而 ， 我 们 最 初 对 于 算法 资源 需求 的 理解 总 是 尝试 用 数量 级 (order-of-magnitude) 分 
析 ， 这 里 我 们 要 用 到 第 1 章 中 介绍 过 的 符号 O、B 和 Q。 尽 管 我 们 的 分 析 不 是 特别 正规 ， 但 却 
经 常 能 够 得 到 有 用 的 信息 。 

例 14.1 给 定 n 个 数 x1,x;,…,x, 的 集合 和 一 个 键 值 <， 判 定 集合 中 是 否 包含 x。 

除非 集合 中 的 数 是 按照 某 种 顺序 排列 的 , 否则 最 简单 的 算法 是 线性 查找 (linear search )。 
在 这 种 算法 中 ， 我 们 要 将 * 与 集合 中 的 数 进行 一 一 比较 ， 直 到 找到 某 个 与 x 匹 配 的 数 或 者 到 
了 集合 中 的 最 后 -个 数字 。 由 于 我 们 要 找 的 数 可 能 在 第 一 次 比较 时 就 能 匹配 ， 也 可 能 到 最 
后 次 才能 匹配 ， 所 以 我 们 不 能 预计 这 需要 多 少 工作 。 但 是 我 们 知道 ， 在 最 坏 的 情况 下 ， 
需要 进行 x 次 比较 。 我 们 因此 可 以 说 这 个 线性 查找 的 时 间 复 杂 度 是 O(n)， 或 者 更 好 一 点 是 
B(n)。 在 对 这 个 问题 进行 分 析 的 了 时候， 我 们 并 没有 指定 具体 的 机 器 或 者 假设 算法 是 如 何 实 
现 的 。 口 


习题 
1. 假设 给 定 一 个 由 n 个 数 x1, zz, …, ,构成 的 集合 ， 并 要 求 判定 集合 中 是 否 存 在 重复 的 数 。 
(a) 给 出 一 个 算法 并 找 出 这 个 算法 的 时 间 复 杂 度 的 数量 级 表达 式 。 


(b) 检查 在 图 灵机 上 实现 该 算法 是 否 会 影响 你 的 结论 。 
2. 对 于 上 面 习题 中 的 集合 ， 现 在 要 求 判 定 集合 中 是 否 存在 三 个 相同 的 数 ， 请 给 出 算法 。 并 且 
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判断 算法 是 否 是 最 高 效 的 。 
3. 回顾 算法 的 选择 是 如 何 影响 排序 效率 的 。 


14.2 图 灵机 和 复杂 性 


在 第 10 章 中 ， 我 们 证 明了 不 同类 型 的 图 灵机 在 解决 问题 的 能 力 上 是 等 价 的 。 这 一 点 使 得 
我 们 在 一 个 具体 的 证 明 过 程 中 可 以 选择 最 方便 的 图 灵机 ， 甚 至 可 以 选择 使 用 高 级 计算 机 语言 
的 程度 ， 从 而 避免 因为 使 用 标准 图 灵机 模型 而 造成 的 复杂 情况 。 但 是 ， 当 我 们 涉及 复杂 性 这 
个 问题 的 时 候 ， 不 同类 型 图 灵机 之 间 的 等 价 性 就 不 再 成 立 了 。 

例 14.2 在 例 9.4 中 ， 我 们 构造 了 一 个 单 带 图 灵机 来 接受 语言 L = {a*b" : n> 1}。 通 过 观察 
算法 ， 我 们 得 出 对 于 w = a"b"， 图 灵机 匹配 每 个 a 和 相应 的 5 大 致 需 要 2n 步 来 完成 。 因 此 ， 这 个 
过 程 需要 O(n’) 时 间 。 

但 是 ， 在 后 来 的 例 10.1 中 ， 我 们 利用 了 双 带 图 灵机 ， 并 且 使 用 了 不 同 的 算法 。 我 们 首先 将 
所 有 的 a 拷贝 到 第 二 个 带 上 ， 然 后 利用 它们 来 和 第 一 个 带 上 的 5b 进行 匹 配 。 找 贝 前 后 的 情况 如 
图 14-1 所 示 。 找 贝 和 匹配 都 能 在 O(n) 时 间 内 完成 ， 因 此 ， 我 们 可 以 看 出 双 带 图 灵机 的 时 间 复 
杂 度 为 O(n)。 口 


wm EE wm 
“TIITIIIIT "TUID 


a) 初始 带 b) 挡 贝 之 后 的 带 


图 14-1 


例 14.3 ”在 5.2 节 和 6.3 节 中 ， 我 们 讨论 了 上 下 文 无 关 语言 的 成 员 判 定 问题 。 如 果 我 们 取 输 
和 符号 串 w 的 长 度 作为 问题 的 规模 ?， 那 么 穷 举 查找 算法 的 复杂 度 为 DO0x 妨 ， 这 里 的 MW 取 决 于 文 
法 。 而 更 有 效 的 CYK 算 法 的 时 间 复 杂 度 为 O(n ) 这 两 种 算法 都 是 确定 型 的 。 

这 个 问题 的 非 确 定型 算法 是 通过 对 构造 w 所 使 用 的 产生 式 的 顺序 进行 推测 来 进行 的 。 如 果 
我 们 使 用 的 文法 没有 单元 或 者 4 产生 式 ， 那 么 推导 的 长 度 就 基本 上 是 |w|， 这 样 我 们 就 得 到 了 一 


个 具有 了 时间 复 杂 度 O(n) 的 算法 。 口 
例 14.4 ”我 们 现在 介绍 可 满足 性 问题 (satisfiability problem) ， 这 个 问题 在 复杂 性 理论 里 
扮演 着 很 重要 的 角色 。 


布尔 (逻辑 ) 常量 或 者 布尔 (逻辑) 变量 都 是 只 能 取 两 个 值 一 一 “ 真 ” 或 者 “ 假 "， 我 们 
用 “1” 和 “0” 来 分 别 表示 它们 。 布 尔 运算 符 将 布尔 常量 和 布尔 变量 组 合成 布尔 表达 式 。 最 
简单 的 布尔 运算 符 有 “或 ”(or) 运算 符 ， 表 示 为 v， 它 的 定义 为 : 
0v1=1lv0=lvl=1l 
Ov0=0 
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和 “与 ”(and) 运算 符 ， 表示 为 ^， 它 的 定义 为 : 
OA0=0Al = 1A0=0 

1A1 = 1 
同样 的 还 有 “ 非 ”(negation) 运算 符 ， 也 称 否定 运算 符 ， 我 们 用 一 条 横 线 来 表示 ， 它 的 定义 
为 : 
0=1 
1=0 
我 们 现在 孝 虑 合 取 范 式 (conjunction normal form) 的 布尔 表达 式 。 在 这 种 形式 中 ， 我 们 先 利 
用 变量 xi, x,,…, x, 来 构造 如 下 形式 的 布尔 表达 式 


e = LALA A (14-1) 
式 中 的 六 5,…, 是 由 变量 或 其 否定 经 过 或 运算 得 到 的 ， 即 
hi= SVSnV Vs, (14-2) 


这 里 的 每 一 个 5,, sw …, sp 代表 了 某 个 变量 或 其 否定 。 

可 满足 性 问题 是 指 : 给 定 一 个 合 取 范式 的 表达 式 e， 然 后 对 其 中 的 每 个 变量 xi, x,,…, x, 进 
行 赋值 ， 那 么 是 否 存在 某 种 情况 下 的 赋值 ， 使 得 表达 式 e 的 最 后 取 值 为 真 。 举 一 个 具体 的 例子 ， 
我 们 来 看 这 个 式 子 


@1= (XV xX)A (XV Xs) 


如 果 我 们 令 x = 0, x = 1, xs = 1， 那 么 表达 式 e, 就 会 取 真 ， 那 么 表达 式 是 可 满足 的 。 另 一 方面 ， 
表达 式 
ez = (XI VX AKAD 


是 不 可 满足 的 ， 因 为 无 论 如 何 对 变量 x, 和 x 进行 赋值 ，es 总 是 取 值 为 假 。 

对 于 可 满足 性 问题 很 容易 发 现 一 个 确定 的 算法 。 我 们 可 以 对 变量 x, x,, …, x, 取 所 有 可 能 
的 值 ， 然 后 计算 表达 式 的 值 。 由 于 有 2" 种 不 同 的 情况 ， 这 种 穷 举 方法 也 就 相应 地 具有 指数 的 
时 间 复 杂 度 。 

此 外 ， 非 确定 型 的 算法 能 够 简化 问题 。 如 果 e 是 可 满足 的 ， 我 们 对 于 每 个 zx 的 取 值 进行 狂 
测 ， 然 后 计算 e 的 值 。 这 是 个 O(n) 量 级 的 算法 。 正 如 在 例 14.3 中 所 示 ， 我 们 有 一 个 确定 型 的 穷 
举 查 找 算法 ， 而 这 个 算法 的 复杂 度 是 指数 量 级 的 。 相 应 地 ， 我 们 还 有 一 个 线性 的 非 确 定型 的 
算法 。 然 而 ， 和 前 一 个 例子 不 同 ， 我 们 这 里 不 知道 任何 非 指 数量 级 的 确定 型 的 算法 。 口 

这 些 例 子 表明 了 复杂 性 问题 的 讨论 是 受 选 定 的 图 灵机 的 类 型 影响 的 ， 而 其 中 确定 型 和 非 


”确定 型 的 不 同 是 很 关键 的 一 点 。 例 14. 1 表明 多 带 图 灵机 上 的 算法 和 我 们 使 用 的 具体 编程 语言 


的 算法 是 很 接近 的 。 因 此 ， 我 们 将 使 用 多 带 图 灵机 作为 我 们 研究 复杂 性 问题 的 模型 。 
习题 
对 于 本 节 的 所 有 习题 ， 假 设 使 用 的 图 灵机 都 是 确定 型 的 。 
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1. 使 用 双 带 图 灵机 来 为 {ww : wEf{a, 5} } 中 的 成 员 构 造 一 个 线性 时 间 的 算法 。 如 果 使 用 单 带 图 
灵机 ， 那 么 能 够 得 到 最 好 的 结果 是 什么 样 的 ? 

2. 证 明 任 何在 单 带 、 离 线 图 灵机 上 能 够 在 OCT(n)) 时 间 内 完成 的 算法 ， 在 标准 图 灵机 上 同样 能 
够 在 O(T(n)) 时 间 内 完成 。 

3. 证 明 任 何在 标准 图 灵机 上 能 够 在 O(T(n)) 时 间 内 完成 的 算法 ， 在 单 向 无 穷 带 图 灵机 上 同样 能 


够 在 O(T(n)) 时 间 内 完成 。 
4. 证 明 任何 在 双 带 图 灵机 上 能 够 在 O(T(n)) 时 间 内 完成 的 算法 ， 在 标准 图 灵机 上 需要 OC(T2(n)) 
时 间 来 完成 。 


5. 将 布尔 表达 式 (xix2)V%3 重 写 为 合 取 范式 。 
6. 判定 下 面 的 表达 式 


(HVEVX)IANT VX VE)A (TVET VT,) 


是 否 是 可 满足 的 。 

7. 在 例 14.2 中 ， 我 们 说 第 一 个 算法 的 时 间 复 杂 度 为 0(n”)， 而 第 二 个 算法 的 时 间 复 杂 度 为 O(n)。 
能 否 更 加 准确 地 表述 为 : 对 于 第 一 个 算法 有 7(z) = 8B(n?)， 而 对 于 第 一 个 算法 有 7(n) = 
GB(n)? 这 个 对 于 我 们 证 明 例 14.2 有 什么 帮助 ? 


14.3 语言 族 和 复杂 性 类 


在 关于 语言 分 类 的 乔 姆 斯 基层 次 结构 中 ， 我 们 将 语言 族 和 自动 机 类 联系 起 来 了 ， 那 里 ， 
自动 机 类 是 根据 它 的 临时 存储 能 力 来 分 类 的 。 另 外 一 种 分 类 的 方法 是 利用 某 种 特定 种 类 的 图 
灵机 ， 同 时 将 时 间 复 杂 度 作为 区 分 的 因素 。 为 此 ， 我 们 首先 来 定义 一 个 语言 的 时 间 复 杂 度 。 

定义 14.1 我 们 说 一 个 图 灵机 在 时 间 T(n) 内 能 够 接受 语言 L， 是 指 对 于 每 个 属于 上 L 的 w， 其 
中 |wj < n， 者 能 在 O(T(n)) 次 迁移 内 被 图 灵机 MM 所 接受 。 如 果 肝 是 非 确定 型 的 ， 这 就 意味 着 对 于 
每 个 wEL， 痢 至 少 存在 一 个 迁移 长 度 为 OC(TK|w|)) 的 序列 ， 使 得 MM 能 够 接受 这 个 符号 囊 。 

定义 14.2 ”如 果 存 在 一 个 确定 型 的 多 带 图 灵机 能 够 在 时 间 T(n) 内 接受 语言 上 ， 那 么 我 们 称 
这 个 语言 是 类 DTIME(T(n)) 的 成 员 。 

如 果 存 在 一 个 非 确定 型 的 多 带 图 灵机 能 够 在 时 间 T(za) 内 接受 语言 L， 那 么 我 们 称 这 个 语言 
是 类 NTIME(T(n)) 的 成 员 。 

这 些 复杂 性 类 之 间 的 一 些 关系 是 明显 的 ， 例 如 : DTIME(T(n))C NTIME(T(n)) 和 Ti(n) = 
O(T(n)) 表明 了 PTIME(T(n))C DTIME(T,(n))。 这 里 开始 很 从 就 变 得 模糊 了 。 我 们 在 这 
里 能 得 到 的 是 随 着 T(n) 级 数 的 增加 ， 我 们 接受 了 更 多 的 语 

定理 14.1 对 于 任何 整数 > [1， 有 


DTIME(n*) C DTIME(n*'!) 


证 明 ; 具体 的 证 明 请 参考 Hopcroft 和 Ullnan (1979，p.299)。 国 
从 这 个 定理 ， 我 们 可 以 得 出 结论 : 一 些 能 够 在 时间 量 级 内 被 接受 的 语言 并 没有 线性 时 间 
的 算法 ; 确实 也 存在 一 些 属于 DTIME(nm’) 而 不 属于 DTIME(n?) 的 语言 ， 等 等 。 这 样 一 来 ， 我 
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们 能 够 给 出 无 穷 个 嵌 套 的 复杂 性 类 。 我 们 甚至 能 够 得 到 更 多 指数 时 间 复 杂 性 类 (如果 人 允许 的 
话 )。 事实 上 ， 在 这 里 并 没有 限制 。 无 论 复杂 性 函数 7T(n) 增长 得 有 多 迅速 ， 总 是 有 些 函 数 超出 
了 DTIME(T(n)) 的 范围 。 

定理 14.2 不 存在 一 个 完全 的 图 灵 可 计算 函数 /(n)， 满 足 每 个 递归 语言 都 属于 DTIME( f(n))。 
证 明 : 给 定 一 个 字母 表 2 = {0, 1}， 其 中 ，Z' 中 的 所 有 符号 串 都 是 按照 固定 顺序 wi, w,, … 排 列 
的 。 同 时 ， 我 们 假设 将 所 有 的 图 灵机 也 按照 固定 顺序 M1,, M,, … 进 行 排列 。 

假设 现在 定理 中 所 说 的 1(m) 是 存在 的 。 那 么 我 们 可 以 定义 语言 


L= {wi: M 在 flwi 步 内 不 接受 w,} (14-3) 


我 们 将 证 明 L 是 递归 的 。 为 此 ， 对 于 任意 的 wEL 首 先 计 算 /(|w|)。 由 假设 /是 一 个 完全 的 图 灵 可 
计算 函数 可 知 ， 这 一 点 是 可 能 的 。 我 们 接 下 来 寻找 w 在 序列 wi, w,, … 中 的 位 置 i。 因 为 整个 序 
列 是 按照 固定 顺序 排列 的 ， 所 以 ， 这 也 是 可 以 做 到 的 。 当 我 们 有 了 i， 我 们 就 能 够 找到 M,， 使 
其 在 w 上 执行 (|w|) 步 。 这 就 能 够 判断 w 是 否 属于 L， 因 此 ，L 是 递归 的 。 

但 是 我 们 现在 要 证 明 L 是 不 属于 DTIME(f(n)) 的 。 先 假设 L 属 于 DTIME(f(n)) 。 既 然 L 是 递 
归 的 ， 那 么 就 存在 某 个 M;， 满 足 L = LCM))。 那 么 wi 是 否 属于 L? 如 果 我 们 说 wi 属于 L， 那 么 Mi 
就 会 在 A(|wi) 步 内 接受 w:。 这 是 因为 LEDTIME(f(n))， 而且 每 个 wEL 都 被 M 在 f(|wl) 步 内 接受 
了 。 但 是 这 与 式 (14-3) 是 矛盾 的 。 相 反 地 ， 如 果 我 们 假设 wiL 也 会 得 到 矛盾 。 这 样 一 个 无 
法 解决 的 问题 使 我 们 得 出 最 初 的 假设 ， 即 可 计算 函数 fn) 的 存在 ， 必 然 是 不 成 立 的 。 面 

定理 14.1 和 定理 14.2 可 以 帮助 我 们 得 出 很 多 结论 ， 例 如 存在 语言 属于 DTIME(n‘)， 但 是 却 
不 属于 DTIME(n*)。 尽 管 这 个 结论 可 能 比较 有 理论 意义 ， 但 是 却 不 清楚 它 有 没有 实际 音义。 这 
里 ， 我 们 并 不 太 清 楚 属于 DTIME(n“) 的 语言 的 特性 是 什么 。 我 们 可 以 将 复杂 性 的 分 类 和 乔 姆 
斯 基层 次 结构 中 的 语言 联系 起 来 ， 那 么 就 可 以 更 加 深入 地 了 解 问 题 。 我 们 下 面 会 通过 几 个 简 
单 的 例子 来 给 出 更 加 明确 的 结论 。 

例 14.5 每 个 正则 语言 都 能 够 被 一 个 确定 型 有 穷 自动 机 接受 ， 而 且 接 受 的 时 间 是 和 输入 的 
长 度 成 正比 的 。 因 此 ，Pasc S DTIME(n) 。 但 是 DTIME(n) 不 仅 包含 了 Lasc。 我 们 在 例 13.7 中 就 
知道 ， 上 下 文 无 关 的 语言 {a"b" : n> 0} 可 以 在 O(n) 时 间 内 被 接受 。 那 里 给 出 的 证 明 甚 至 可 以 用 
于 更 为 复杂 的 语言 。 口 

例 14.6 非 上 下 文 无 关 语 言 Z = {ww : wE{a, 5}} 是 属于 NTIME(n) 的 。 这 一 点 比较 直观 ， 
我 们 可 以 对 这 个 语言 中 符号 串 进行 识别 ， 使 用 下 面 的 算法 来 完成 : 

1. 将 输入 从 输入 文件 拷贝 到 第 一 个 带 上 ， 非 确定 地 猜 铀 符号 串 的 中 间 位 置 。 

2. 将 第 二 部 分 拷贝 到 第 二 个 带 上 。 

3. 逐个 比较 第 一 个 带 上 的 符号 和 第 二 个 带 上 的 符号 。 
显然 ， 所 有 这 些 步骤 都 可 以 在 O(|w|l) 时 间 内 完成 ， 因 此 LENTIME(n)。 

实际 上 ， 我 们 可 以 证 明 如 果 能 够 构造 算法 在 O(n) 时间 内 找到 符号 串 的 中 间 位 置 ， 那 么 
LEDTIME(n)。 这 个 寻找 中 间 位 置 的 算法 可 以 这 么 实现 :我 们 观察 第 一 个 带 上 的 每 个 字符 ， 
同时 在 第 二 个 带 上 保存 个 数 ， 但 是 只 是 在 偶数 个 符号 的 时 候 计 数 。 我 们 将 具体 的 细节 留 作 
习题 。 口 

例 14.7 ”从 例 14.2 我 们 可 以 得 到 LC DTIME(n;) 和 Le C NTIME(n) 。 现 在 ,我 们 来 考虑 
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上 下 文 相 关 语 言 族 。 由 于 每 一 步 可 以 使 用 的 产生 式 是 有 限 的 ， 所 以 穷 举 查找 算法 也 是 可 行 的 。 
因此 ， 每 个 长 度 为 m 的 符号 串 都 可 以 在 时 间 吃 内 被 分 解 ， 这 里 的 M 是 依赖 于 文法 的 。 注意 ， 尽 
管 如 此 ， 我 们 却 不 能 根据 这 个 得 出 

Les CG DTIME(nY) 


这 是 因为 我 们 不 能 给 出 M 的 上 界 。 [LL] 
从 这 些 例子 中 ， 我 们 观察 得 出 一 个 趋势 : 随 着 T(n) 的 增加 ， 越 来 越 多 的 语言 族 ， 如 LrgG、 
Lcre、L 上 cs 被 包含 进来 。 但 是 乔 姆 斯 基层 次 结构 和 复杂 性 类 之 间 的 联系 确实 是 薄弱 的 、 不 很 清 
晰 的 。 
习题 
完成 例 14.5 中 的 证 明 。 
证 明 L = {wwrw : wE{a,b}+} 是 属于 DTIME(n) 的 。 
. 证明 L = {www : wEf{a,b5})!} 是 属于 DTIME(n) 的 。 
证 明 存 在 不 属于 NTIME(2") 的 语言 。 


14.4 复杂 性 类 P 和 NP 


既然 通过 具有 不 同 增长 率 的 时 间 复 杂 度 来 构造 有 意义 的 层次 结构 是 没有 成 效 的 ， 那 么 我 
们 就 需要 忽略 --- 些 次 要 的 因素 ， 例 如 去 掉 一 些 没 有 意义 的 区 别 ， 如 DTIME(n*) 与 DTIME(n** 1!) 
之 间 的 区 别 。 我 们 可 以 证 明 这 种 区 别 ， 比 如 说 DTIME(n) 和 DTIME(m) 之 间 的 区 别 ， 是 非 本 质 
性 的 ， 因 为 它 可 能 依赖 于 具体 的 图 灵机 模型 (例如 图 灵机 的 带 的 个 数 )， 并 且 我 们 不 知道 究竟 
哪个 模型 最 适合 一 个 真实 的 计算 机 。 这 使 得 我 们 得 出 了 著名 的 复杂 性 类 


相 wm 一 


P = (J pTIMEn’') 
这 个 类 包含 了 可 以 被 某 个 确定 型 图 灵机 在 多 项 式 时 间 内 接受 的 所 有 语言 ， 这 里 没有 考虑 多 项 
式 的 震级 。 正 妈 我 们 所 看 到 的 ， Lrec 和 Le 都 属于 P。 
由 于 确定 型 复杂 度 和 非 确 定型 复杂 度 的 区 别 是 本 质 性 的 ， 所 以 我 们 引入 


NP = (JNTIMEn') 
了 > 上 


显然 PENP ， 但 是 我 们 不 知道 这 个 包含 是 否 是 真 包含 。 虽 然 普遍 认为 存在 属于 NP 但 是 不 属于 
P 的 语言 ， 但 是 到 目前 为 止 ， 还 没有 人 发 现 这 样 一 种 语言 。 

对 于 复杂 性 类 的 研究 ， 尤 其 是 对 P 类 问题 ， 是 源 于 对 真实 和 非 真实 计算 的 区 分 。 某 些 计算 
虽然 在 理论 上 是 可 行 的 ， 但 是 它 对 资源 的 要 求 过 高 ， 超 过 了 一 般 计算 机 甚至 是 超级 计算 机 的 
能 力 。 我 们 有 时 称 这 样 的 问题 为 难 解 的 (intractable )， 以 此 来 表明 这 种 问题 虽然 原则 上 是 可 
解 的 ， 但 是 在 真实 的 计算 环境 下 ， 是 没有 希望 来 完成 这 个 算法 的 。 为 了 更 好 地 理解 这 类 问题 ， 
计算 机 科学 家 们 尝试 着 为 这 种 难 解 性 构造 一 个 形式 化 的 基础 。 其 中 在 Cook-Karp 论 题 (cook- 
karp thesis) 中 ,就 曾经 尝试 着 对 这 个 概念 进行 定义 。 在 Cook-Karp 论 题 中 ， 一 个 问题 如 果 属 


(AD 
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于 P， 那 么 就 称 之 为 可 解 的 ， 若 不 属于 P， 则 称 之 为 难 解 的 。 

那么 Cook-Karp 论 题 是 否 能 够 很 好 地 区 分 可 以 实际 解决 的 问题 和 难 解 问 题 呢 ? 答案 是 不 清 
晰 的 。 显 然 ， 任 何不 属于 P 的 计算 具有 的 时 间 复 杂 度 的 增长 速度 都 要 比 多 项 式 要 快 ， 而 它 的 
需求 会 随 着 问题 规模 的 增 大 而 非常 迅速 地 增 大 。 即 使 对 于 像 207 这 样 的 国 数 ， 取 比较 大 的 "， 
如 > 1000， 其 需求 都 会 过 高 。 对 于 将 这 种 问题 称 为 难 解 问题 ， 也 许 我 们 认为 是 正当 的 。 但 
是 对 于 属于 DTIMEln'”) 的 问题 呢 ? 虽然 Cook-Karp 论 题 认为 这 样 一 个 问题 是 可 解 的 ， 但 是 即 
使 对 很 小 的 x*， 我 们 也 无 法 处 理 。Cook-Karp 论 题 的 正确 性 好 像 来 源 于 对 于 一 些 实际 问题 的 观 
蹇 ， 如 P 类 中 绝 大 多 数 问题 属于 DTIME(n)、DTIME(w)、DTIME(m)， 而 不 在 此 类 中 的 问题 往 
往 具 有 指数 复杂 度 。 在 实际 的 问题 中 ， 属 于 P 类 的 问题 和 不 属于 P 类 的 问题 之 间 存 在 着 明显 的 
差异 。 

复杂 性 类 P 和 NP 之 间 的 关系 的 研究 引起 了 很 多 科学 家 的 兴趣 。 这 个 研究 的 根本 在 于 问题 


P = NP 


是 否 成 立 。 

这 个 问题 也 是 计算 理论 中 尚未 解决 的 基础 性 问题 。 为 了 研究 这 个 问题 ， 计 算 机 科学 家 已 
经 引入 了 各 种 相关 的 概念 和 问题 。 其 中 一 个 就 是 NP 完 全 问题 。 粗 略 地 讲 ， 一 个 NP 完 全 问题 和 
任何 NP 问 题 一 样 难 ， 从 某 种 意义 上 讲 ， 它 们 都 是 等 价 的 。 我 们 将 在 后 边 给 出 详细 解释 。 

定义 14.3 ”如 果 存在 一 个 确定 型 图 灵机 能 够 将 六 中 字母 表 上 的 wi 在 多 项 式 时 间 内 转换 为 六 
中 的 字母 表 上 的 w，， 同 时 使 得 wiEL1 当 且 仅 当 wJEL,。 闭 么 我 们 称 语言 L 可 以 在 多 项 式 时 间 归 
约 (polynomial-time reducible ) 为 语言 L,。 

从 这 里 我 们 可 以 得 出 ， 如 果 L 可 以 多 项 式 时 间 归 约 到 L,， 并 且 如 果 L,EP， 那 么 L/EP。 同 
样 ， 如 果 L,ENP， 那 么 L,ENP，。 

定义 14.4 ”如 果 语 言 LENP， 而 且 每 个 L'ENP 都 可 以 多 项 式 时 间 归 约 到 LL， 那 么 我 们 称 L 是 
NP 完全 的 。 

从 定义 我 们 可 以 很 容易 地 得 出 ， 如 果菜 个 LL 是 NP 完全 的 ， 而 且 可 以 多 项 式 时 间 归 约 到 L,， 
那么 六 也 是 NP 完 全 的 。 定 义 隐 含 了 这 样 结论 : 如 果 我 们 能 够 为 任意 一 个 NP 完 全 的 语言 构造 一 
个 确定 型 的 多 项 式 时 间 算 法 ， 那 么 所 有 的 属于 NP 的 语言 同时 也 属于 P， 即 

P= NP 


这 使 得 NP 完全 性 在 这 个 问题 的 研究 中 扮演 了 核心 的 角色 。 

例 14.8 ”可 满足 性 问题 可 以 被 视 为 一 个 语言 问题 。 我 们 可 以 将 每 个 实例 作为 字符 串 进 行 
编码 ， 使 得 当 且 仅 当 表达 式 可 满足 的 时 候 ， 符 号 串 才 被 接受 。 这 个 问题 是 NP 完 全 的 。 可 满足 
性 问题 是 NP 完全 ， 这 个 命题 被 称 为 Cook 定 理 。 具 体 的 讨论 请 参阅 Hopcroft & Ullman 
(1979 )。 口 

除了 可 满足 性 问题 ， 人 们 还 发 现 了 很 多 其 他 的 NP 完 全 问题 。 对 于 所 有 这 些 问 题 ， 我 们 
都 能 够 构造 指数 级 的 算法 ， 但 是 对 于 这 些 问 题 ， 至 今 没 有 发 现 它们 中 任何 一 个 的 多 项 式 时 间 
的 算法 。 这 个 事实 使 得 人 们 认为 很 可 能 P* NP。 但 是 ， 除 非 能 够 构造 出 一 个 实际 的 属于 NP 
但 是 却 不 属于 P 的 语言 ， 或 者 证 明 没有 这 样 的 语言 存在 ， 理 则 这 个 问题 始终 是 悬而未决 的 。 
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习题 
1. 证 明 : 如 果 一 个 语言 L 是 NP 完全 的 ， 并 且 可 以 在 多 项 式 时 间 归 约 到 L,， 那 么 L 也 是 NP 完 
全 的 。 


友 克 2. 参考 复杂 性 理论 的 相关 书籍 ， 编 制 一 个 NP 完全 的 列表 。 
3.P = NP 是 否 有 可 能 是 不 可 判定 的 ? 





部 分 习题 的 解答 和 提示 


第 1 章 
1.1 

5. 要 证 明 两 个 集合 相等 ， 必 须 证 明 一 个 元 素 属于 第 一 个 集合 当 且 仅 当 它 属 于 第 二 个 集合 。 假 设 
xES US ， 则 xESiUS ， 意 思 是 x 不 可 能 在 9 或 $ 中 ， 即 xE5 门 5,。 相 反 地 ， 车 x*E5 Ns, 则 x 不 在 5 中 
也 不 在 5 中 ,， 即 xES US,。 

6. 可 以 通过 对 集合 的 数目 进行 归纳 来 证 明 。 设 Z = 8IUS…US,， 则 SIUS…US,US, ,1 = ZUS, ,1。 由 
标准 德 摩根 定律 得 


ZUS = ZN Sn 
由 归纳 假设 ,此 关系 对 前 n 个 集合 成 立 ， 即 
Z= 51N52N-...Ns, 
所 以 
ZUS ,= SMS NMS N Son 


归纳 完毕 。 
8. 假设 5, = 5;， 则 Si 站 到 =- 各 ng -= 5, 阁 5 -GB ， 整 个 表达 式 等 于 空 集 。 现在 假设 $1 5,， 并 设 有 一 
个 元 素 x 在 8 中 但 不 在 3 中 ， 则 xEg ， 于 是 $n5, zB 。 于 是 整个 表达 式 不 可 能 等 于 空 集 。 
12. 如 果 * 既 在 8 中 又 在 9 中， 则 xz 不 属于 (S1U52) -5;。 因 此 ， 充 分 必要 条 件 是 两 个 集合 不 相交 。 
15. (c) 因为 


是 小 于 等 于 1 的 因子 的 乘积 ， 所 以 n! = O(n”)。 
27. 用 反 证 法 。 假 设 2- V2 是 有 理 数 ， 则 


2-\ 人 -二 
m 
即 
7 -27 
m 


这 与 V2 不 是 有 理 数 的 事实 相 矛 盾 。 
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29. 用 归纳 法 。 设 所 有 小 于 "的 整数 都 可 写成 质数 的 乘积 。 如 果 " 是 质数 ,立即 得 证 ; 如果 n 不 是 质数 ， 
则 它 可 写成 


n= nn, 


其 中 两 个 因子 都 小 于 上 。 由 归纳 假设 ， 它 们 都 可 以 写成 质数 的 乘积 ， 于 是 * 也 可 以 写成 质数 的 乘积 。 


1.2 
2. 很 多 关于 符号 串 的 等 式 都 可 以 用 归纳 法 证 明 。 设 对 于 所 有 的 wxEz "和 长 度 为 nz 的 符号 圳 v， 有 (uv)* 
= vtu*。 现 在 取 一 个 长 度 为 n+ 1 的 符号 串 ， 比 如 说 w = va， 则 
(uw)® = (uva)e 
= a(uv) (由 逆 的 定义 ) 
= av (由 归纳 假设 ) 


二 whu® 


由 归纳 法 ， 结 论 对 所 有 符号 串 都 成 立 。 
4. 由 于 abaabaaabaa 可 以 被 分 解 为 子 串 a4bp，aa，baa，ab，aa， 其 中 每 个 子 串 都 属于 L， 所 以 原 符号 
捉 属 于 L'"。 类 似 地 ，baaaaabaa 属 于 L*、 但 对 于 baaaaabaaaab 不 存在 可 能 的 分 解 ， 因 此 它 不 属于 L'*。 
10. (d) 我 们 先生 成 三 个 a， 然 后 再 在 任意 位 置 添加 任意 个 a 和 4b。 
S—AaAaAhaA 


A—aA|bA|A 


第 一 个 产生 式 生 成 三 个 a， 第 二 个 产生 式 在 任意 位 置 产 生 任意 个 a 和 b。 从 而 上 述 文法 可 以 产生 任意 符号 
串 wE{fa, pb) ， 只 要 mw) >3。 
11. 


S=>aA=>abS=—abaA=>ababs 
由 此 可 得 
L(G) = {(ab)’ :n>0} 
13. (a) 生成 一 个 b，， 然 后 再 生成 相同 数目 的 a 和 65， 最 后 可 根据 需要 生成 任意 多 个 b。 
S—AbA 
A-—>aAB|A 
B—bBIA 
13. (gd) 如 果 你 注意 到 
Li= {a”'b”:m>20} 
问题 就 比较 容易 了 。 
可 以 很 容易 得 到 答案 
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S—aaaA 
A—adb|A 
14. (b) 我 们 可 以 将 问题 分 成 两 种 情况 来 讨论 ， 从 而 将 问题 化 简 ， 即 |wjmod 3 = 1 和 |wlmod 3 = 2。 
第 一 种 情况 由 下 式 产 生 


Si 一 adaaSila 


第 二 种 情况 由 下 式 产生 


Ss,—aaaS,laa 


上 述 两 种 情况 可 以 统一 为 一 个 文法 
S—51|S, 


16. (a) 我 们 可 以 利用 例 1.13 中 的 方法 和 结果 。 设 为 例 1.13 中 的 语言 ， 修 改 其 语法 使 得 开始 符号 
是 S,。 然后 考虑 符号 串 wEZL。 如 果 w 的 起 始 符号 是 ae， 则 w 形 如 w = aw,， 其 中 w,EL,。 这 种 情况 可 以 用 产 
生 式 S->a51 处 理 。 如 果 w 以 5 开头， 则 可 以 由 产生 式 5->515 产 生 。 


1.3 


整数 一 符号 ”数量 

符号 一 +| 一 从 

数量 一 数字 | 数字 数量 

数字 ->0|11213|4|5161718]9 
我 们 可 以 将 上 述 语法 看 作 理想 的 C， 因 为 它 对 整数 的 长 度 没有 作 限制 。 大 多 数 实际 的 编译 器 都 会 对 整数 
的 长 度 作出 限制 。 

7. 自动 机 必须 在 一 段 时 间 内 记 住 输入 ， 从 而 可 以 在 稍 后 将 其 重新 产生 以 便 输出 。 我 们 可 以 通过 用 合 

适 的 信息 来 标记 状态 以 达到 这 种 记忆 的 功能 。 状 态 的 标记 稍 后 将 被 产生 并 用 作 输 出 。 





10. 我 们 通过 将 状态 加 上 标记 从 而 记 住 输入 。 当 处 理 完 三 个 位 (bit) 时 ， 我 们 产生 输出 并 回 到 开始 
以 便 处 理 接 下 来 的 三 个 位 。 下 面 的 解 只 是 部 分 的 ， 但 完整 的 解 是 显而易见 的 。 
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11. 在 本 题 中 ， 传 感 器 必须 记 住 输入 的 前 两 个 符号 并 作出 相应 的 转换 以 记 住所 需 的 信息 。 


0/0 





第 2 章 
2.1 


2. (c) 将 其 分 为 4 种 情况 ， 每 种 包含 一 个 接受 状态 : 没有 a 的 ， 有 一 个 a 的 ， 有 两 个 4 的 ， 有 三 个 a 的 。 
第 四 个 o 会 使 dfa 进 入 非 接受 的 陷阱 状态 。 下 面 是 一 种 解 : 


-00.60 
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5. (a) 检查 前 六 个 符号 。 如 果 它 们 不 正确 则 拒绝 。 如 果 前 绎 正确 ， 则 我 们 检查 最 后 两 个 输入 符号 ， 
如 果 是 pbp，dfa 就 进入 接 受 状态 。 





ab 


7. (a) 使 用 标记 为 |w|mod 3 的 状态 ， 则 解 是 相当 简单 的 。 


mb 


-OO 


(d) 对 于 此 种 情况 ,我 们 使 用 9 个 状态 ， 每 个 标记 的 第 一 部 分 是 m(w)mod 3， 第 二 部 分 是 mm(w)mod 3。 
于 是 很 容易 得 出 转换 和 终 态 。 





9. (a) 对 连续 的 0 的 个 数 进行 计数 ， 从 而 得 到 dfa 的 主要 部 分 。 


然后 加 入 其 他 转换 以 处 理 连续 的 0， 并 为 不 可 接受 的 符号 串 设置 陷阱 。 
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0,1 


(d) 这 里 我 们 需要 记 住 三 个 位 的 所 有 组 合 情 况 。 这 需要 8 个 状态 和 一 个 初 态 。 解 比较 长 但 并 不 难 。 
下 面 给 出 的 是 部 分 解 。 





13. 解决 这 个 问题 的 最 简单 的 方法 就 是 构造 一 个 dfa 使 其 接受 语言 L = {a” : n = 4}， 然 后 计算 这 个 dfa 
的 补 。 


一 人 a CC) a CC) a @ a 者 a 月 
21. (a) 用 反 证 法 。 设 Gw 从 初 态 到 任何 一 个 终 态 都 没有 回路 。 于 是 每 一 个 通道 都 有 有 限 的 步 数 ， 
因而 每 一 个 被 接受 的 符号 串 的 长 度 都 一 定 是 有 限 的 。 但 这 就 意味 着 被 接受 的 语言 是 有 限 的 。 
(b) 用 反 证 法 。 设 Cw 从 初 态 到 某 个 接受 状态 存在 某 个 回路 。 于 是 我 们 可 以 利用 这 个 回路 产生 任意 
长 的 、 标 记 有 可 接受 符号 串 的 通道 。 但 一 个 有 限 的 语言 是 不 能 包含 任意 长 的 符号 串 的 。 
24. 本 题 有 很 多 不 同 的 解 。 此 处 给 出 其 中 的 一 个 。 
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2.2 


4. 5°(qgo, a) = {qo0, qu 92}, (qi, A) = {qo 92}。 
7. 具有 4 个 状态 的 解 是 容易 得 出 的 ， 但 是 具有 三 个 状态 的 解 稍 难 一 些 。 下 面 给 出 一 个 三 个 状态 的 解 : 


oA 
GD 


8. 否 。 符 号 电 abc 有 三 个 不 同 的 符号 ， 于 是 它 不 可 能 被 少 于 三 个 状态 的 自动 机 接受 。 
15. 对 于 此 类 问题 ， 你 只 需要 尝试 不 同 的 方法 即 可 找到 答案 。 可 能 你 的 大 部 分 尝试 都 会 失败 。 下 面 
给 出 一 个 解 。 


a 


| 
< 


17. 引入 一 个 唯一 的 开始 状态 ps。 然后 加 入 一 个 转移 函数 
6(po, A) = Oo 


接 下 来 ， 从 Qo 中 去 掉 开始 状态 。 易 见 ， 新 的 nfa 与 原来 的 等 价 。 
20. 引入 一 个 非 接受 的 陷阱 状态 ， 然 后 将 所 有 没有 定义 的 转换 都 连接 到 这 个 新 状态 上 。 解 : 


6 
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2.3 


2. 只 需 呆 照 nfa_to_dfa 过 程 进 行 变换 即 可 。 得 到 的 dfa 为 


7. 引入 一 个 新 的 终 态 m， 并 对 于 所 有 4EF， 添 加 一 个 转移 函数 
6(g, 4) = {py} 


然后 将 p/ 作 为 唯一 的 终 态 。 于 是 很 容易 证 明 若 原 来 6(qo, w)EF， 则 修改 后 为 6(qo, w) = {pi}。 因 此 原 nfa 与 
修改 后 的 nfa 是 等 价 的 。 因 为 这 一 构造 需要 使 用 转移， 因而 不 能 被 用 于 dfa。 一 般 情况 下 ，dfa 不 可 能 只 
有 一 个 终 态 ， 比 如 接受 语言 {4, a} 的 dfa。 

8. 此 题 有 一 定 难度 。 下 面 是 一 个 解 





11. 设 L = {wi,w,,…, wa}。 则 有 nfa 





接受 语言 上 ZL， 于 是 此 语言 是 正则 的 。 

14. 这 一 点 并 不 显而易见 。 方 法 是 对 接受 语言 ZL 的 dfa 进 行 修改 使 其 记 住 已 经 读 和 人 的 符号 的 个 数 是 偶 
数 还 是 奇数 。 这 可 以 通过 将 每 一 个 状态 变 为 两 个 状态 ， 将 0 或 E 添 加 到 标记 中 来 解决 。 例 如 ， 如 果 dfa 的 
局 部 如 下 
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它 的 等 价 变换 如 下 





通过 儿 个 例子 ， 你 一 定 会 确信 : 如 果 原 dfa 接 受 aiazxasas， 则 新 的 自动 机 将 接受 AazMa… ， 从 而 接受 
even(L)。 

15. 假设 有 一 个 dfa 接 受 L。 我 们 

(a) 找 出 所 有 从 go 状态 读 和 人 含 两 个 符号 的 前 组 v 能 达到 的 状态 的 集合 ， 即 


CQ ={qEQ:6'(g0,v) = 9} 
(b) 引入 一 个 新 的 初 态 po 并 添加 转换 
6(po,A)=0O 


不 难看 出 新 的 nfa 能 够 接受 chop 2(Z)。 
虽然 上 述 构造 是 可 行 的 ， 但 完整 的 答案 还 应 该 包括 对 上 面 最 后 一 个 陈述 的 证 明 。 


2.4 





此 dfa 是 最 小 的 。 原 因 如 下 : qr HqEF, 因此 q; 和 qs 是 可 区 分 的 。 然 后 ， 6'(g,, a)FgF HO(g, a)EF,， 因 
此 9 和 44 是 可 区 分 的 。 类 似 地 ，56 (9 aq)gF 且 6'(q3, aa)EF， 因 此 9 和 4; 是 可 区 分 的 。 照 此 继续 下 去 ， 可 
见 所 有 状态 都 是 可 区 分 的 ， 于 是 此 dfa 是 最 小 的 。 
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4. 首先 ， 去 掉 不 可 达 状 态 q9, 和 9s， 然 后 用 mark 过 程 找到 不 可 区 分 的 状态 对 (go, 91) 和 (gs, 95)， 便 


得 到 了 最 小 的 dfa。 
0 0,1 


(ee) 


6. 用 反 证 法 。 假 设 好 不 是 最 小 的 。 于 是 我 们 便 可 以 构造 出 一 个 更 小 的 dfa 1 使 其 接受 语言 过。 
在 内 中 ， 对 终 态 求 补 使 其 接受 语言 。 但 这 个 dfa 比 M 小 ， 与 假设 M 是 最 小 的 矛盾 。 

10. 用 反 证 法 。 假 设 4, 和 gq. 是 不 可 区 分 的 。 因 为 4 和 gs 是 不 可 区 分 的 ， 并 且 不 可 区 分 性 是 一 种 等 价 关 
系 〈 习 题 7) ， 于 是 4. 和 4. 一 定 是 不 可 区 分 的 。 


第 3 章 
3.1 


2. 是。 因为 ((0 + D(0 + 1D) 7 可 以 表示 任何 一 个 由 0 和 1 构成 的 符号 种， 而 (0 + 1) 也 是 如 此 。 
5. (a) 按 m = 0, 1, 2, 3 分 成 4 种 情况 。 产 生 4 个 或 更 多 的 4， 后 面 按 要 求 产生 一 定数 量 的 5»。 解 : 
aaaaa'(A+ b+bb+ bbb). 
(c) 5 (a) 中 语言 的 补 更 难 找到 。 如 果 一 个 符号 捉 形 如 a"b”(n<4 或 者 m>3)， 则 它 不 在 L 中 ， 但 这 
并 不 是 对 工 的 完全 描述 。 工 中 还 应 包括 这 样 的 符号 串 ， 其 中 一 个 b 后 面 跟着 一 个 a。 解 : 
(A+a+aa+aaa)b’ +a'bbbbb’ + (a + b)’ ba(a + b)’ 


9. 分 为 三 种 情况 : m= 1，n>3; n>2,，m>2; n= 1,，m>3。 每 一 种 情况 有 一 个 直接 的 解 。 
12. 枚 举 所 有 |v| = 2 的 情况 ， 得 到 


aa(la + b) aa + ab(a + b) ab + ba(a + b)’ ba + bb(a + b)'bb 
14. (c) 符号 串 只 需要 包含 每 种 符号 至 少 一 个 。 下 式 即 可 : 


(atbt+c) alatb+t+c) blatb+c) clatb+ce) 


但 此 式 并 不 完全 ， 比 如 其 中 一 定 出 现 的 a 总 是 在 一 定 出 现 的 b 之 前 。 要 给 出 完全 的 解 ， 必 须 枚 举 三 个 符号 
的 所 有 排列 。 我 们 可 以 再 增加 六 个 项 。 答 案 虽 然 很 长 ， 但 概念 上 并 不 难 ，。 

15. (c) 产生 两 个 0， 中 间 填 人 一 些 1， 然 后 重复 。 但 不 要 忘记 一 个 0 都 没有 的 情况 。 解 : (101501 人 小 
+1'。 

16. (a) 产生 所 有 长 度 为 3 的 符号 串 并 重复 。 一 个 简短 的 解 是 ((a+b+c)(a+b+c)(a+b+c))’。 

18. (c) 断言 

(ri+ r2) (rr ) 

是 真 的 。 根 据 给 定 的 规则 ，(r, + m) 表示 语言 (L(r)UL(r,))*， 即 由 L(r1) 中 符号 串 和 Zr 中 符号 串 构成 的 
所 有 连接 。 而 (mm ) 表示 ((L(71))(L(r2)))， 也 是 由 L(r1) 中 符号 串 和 Zr;) 中 符号 串 构 成 的 所 有 连接 。 

21. 一 个 无 穷 语言 的 表达 式 必 须 包含 至 少 一 个 带 星 号 的 子 表 达 式 ， 否 则 它 只 能 表示 有 限 多 个 符号 申 。 
如 果 有 一 个 带 星 号 的 子 表达 式 表 示 了 一 个 非 空 符号 串 ， 则 此 子 表达 式 就 可 以 被 重复 任意 多 次 从 而 产生 任 
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意 长 的 符号 申 。 

23, 表达 式 r 能 产生 闭 包 ， 当 且 仅 当 n(7) = n,(7) 并 且 n,(7) = nd(7)。 

25. 注意 以 下 几 点 : 位 串 必 须 至 少 有 6 位 长 ; 如 果 比 6 位 长 ， 它 的 值 至 少 是 64， 则 一 定 满足 要 求 ; 如 
果 正 好 6 位 ， 则 要 么 从 左边 数 第 二 位 (16) 是 1， 要 么 从 右边 数 第 三 位 (8) 是 1。 如 果 认 识 到 上 述 几 点 ， 
则 很 容易 得 到 解 

(11l + 110+ 101)0 + 1)(0 + 1)(0+1)+ 
1(0+ DO+ DO+ DO +OL + 0 + 0 + 0)" 


3.2 


3. 本 题 可 以 根据 前 儿 个 规则 解答 ， 而 不 必用 从 表达 式 到 dfa 的 标准 构造 过 程 。 用 后 者 显然 可 以 解 题 ， 
但 答案 要 复杂 一 些 。 解 : 


as 
2 


:二 
6 


4. (a) 先 构 造 出 





然后 应 用 标准 的 nfa 到 dfa 的 构造 算法 。 
7. 一 种 情况 是 


因为 从 9 到 9 没有 路 径 ， 所 以 我 们 省 去 了 通常 情况 下 由 此 路 径 生 成 的 边 。 通过 查看 所 有 可 能 的 路 径 ， 我 
们 得 到 的 结果 是 
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我 们 对 其 他 情况 可 以 进行 类 似 的 分 析 。 
8. 去 掉 中 间 的 顶点 ， 得 到 


XD 
| (arDab | 


“ brab 


所 接受 的 语言 是 L(r)， 其 中 +r = a'(a + b)ab(bb + ab + aa'(a + bjab)'。 
10.(b) 首先 我 们 必须 修改 nfa 使 其 满足 定理 3.2 中 构造 过 程 要 求 的 条 件 ， 其 中 之 一 是 qoFEF。 这 一 过 
程 很 简单 。 


4 6 
-OY OD 
, 
站 ， 
DC 


aa+b 


然后 去 掉 状 态 3。 
ba 


接 下 来 去 掉 状态 4。 
{ab + (aa + BJ(ba)* bb 


OC) 
于 是 正则 表达 式 为 r = (ab + (aa + b)(ba) bb 。 
17. (a) 这 是 一 个 难题 ， 除 非 你 能 看 出 其 中 的 容 门 。 首 先 构 造 一 个 dfa， 其 状态 为 go, 91, …， 并 引入 
-个 “平行 ”自动 机 ， 其 状态 为 珊 , 所 …。 然 后 在 原 自 动机 的 各 个 状态 与 平行 自动 机 的 相应 状态 之 间 建 
立 转 换 ， 使 得 伪 字 母 可 以 非 确定 地 从 原 自动 机 中 的 任何 一 个 状态 转换 到 平行 自动 机 的 相应 状态 。 例 如 ， 


如 果 原 dfa 的 局 部 如 下 
一 (9 ) a 个 6 





衣 分 习题 办 习 丛 和 起 示 259 


则 此 dfa 加 上 其 平行 部 分 得 到 的 新 nfa 的 局 部 相应 为 





不 难 证 明 ， 原 dfa 接 受 语言 L 当 且 仅 当 新 的 nfa 接 受 语言 insert(L)。 
3.3 


4. 右 线性 文法 : 
9 一 004 
A—=ah|B 
B—>bbbC 
C—bC|A 
左 线性 文法 : 
S—Abbb 
A—Ab|B 
B—>aaC 
C—aC|A 
7. 我 们 可 以 通过 归纳 证 明 : 如 果 w 是 由 G 生 成 的 句 型 ， 则 ws 可 以 被 G 在 同样 步 数 之 内 生成 。 
因为 w 是 由 左 线性 推导 构造 的 ， 它 的 形式 必 为 w = hw,， 其 中 AEV，wiET"。 根 据 归 纳 假设 可 知 w* = 
wi*4 可 以 由 G 生 成 。 现 在 ， 如 果 我 们 应 用 4 一 Bv， 则 
w= BvwI 


但 6G 包含 产生 式 4->v*B， 因 此 有 
w” = wrv*B 
=(Bvw)® 
归纳 完毕 。 
10. 分 为 两 种 情况 : (i) 和 mm 都 是 偶数 ，(ii) n 和 m 都 是 奇数 。 答 案 很 容易 得 出 ， 下 面 给 出 情况 (i) 
的 产生 式 
S—aaSlA 
A—bbA|A 
12. (a) 首先 构造 一 个 接受 语言 L 的 dfa。 这 一 过 程 是 直接 的 ， 得 到 转换 如 下 


igo, a) = gi, (go, b) = 42 
qi, a) = go, gi, b) = 43 
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6(q,, a) = q3, Hq,, b) = go 
6(g;, a) 二 92， 6(g;, b) 三 91 


其 中 qo 既 是 初 态 也 是 终 态 。 然 后 根据 定理 3.4 得 答案 如 下 


qoaqilbg,lA 
qi™>bqslago 
qaqslbqo 
qag,lbq! 


16. 显然 ，51, 和 5 都 是 正则 的 。 我 们 可 以 通过 构造 如 下 dfa 证 明 它们 的 并 也 是 正则 的 


接受 L(Gi) 的 nfa 
小 
接受 L(G,) 的 nfa 


VV 和 VV 不 相交 的 条 件 是 必要 的 ， 这 保证 了 两 个 dfa 是 不 同 的 。 
第 4 章 


4.1 
2. (a) 构造 过 程 是 直接 的 ,但 元 长 。 接 受 语言 L((a + b)a’) 的 dfa 是 由 下 列 转移 函数 得 到 的 : 
(go, a) = gq1, qo,b)= qi, 6(qi,a) = qi, (qi,b)=g, 
其 中 4 是 陷阱 状态 ，q1 是 终 态 。 接 受 语言 L(baa’) 的 dfa 是 由 下 列 转移 函数 得 到 的 : 


So a) = p,, (po, b) =p1, pi, a) = p, 
Sp1, b) 三 PP op,, a) = pp,, 6(p,, b) =p, 
其 中 P; 是 终 态 。 由 此 我 们 得 到 
Sd((40, po), a) = (qi1, pi), di((qo, po), b) = (q1, p1) 
d((q1, Pp1), a) = (qi, p2), 6((q1, p2), a) = (qi1, p2) 


其 他 转移 函数 类 似 。 当 我 们 完成 上 述 构造 时 ， 会 发 现 唯 一 的 终 态 是 (qi, p,)， 且 La + bja NL(baa’) = 
baa’。 


7. 注意 到 





nor(h, Lb)= HUD 


于 是 结果 可 以 由 交 运 算 和 补 运算 的 封闭 性 得 到 。 
12. 答案 是 肯定 的 。 可 以 由 下 面 的 集合 等 式 得 到 


b= UIINDULND) 
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关键 要 注意 到 由 于 Li 是 有 限 的 ， 所 以 LNL 是 有 限 的 ， 于 是 所 有 的 L, 都 是 正则 的 。 然 后 根据 已 知 的 并 运算 
和 补 运算 下 的 封闭 性 就 可 以 很 容易 地 得 到 其 余 答案 。 





14. 正则 语言 在 反 运算 下 是 封闭 的 ，L"* 是 正则 的 。 然 后 可 以 根据 连接 运算 下 的 封闭 性 得 到 答案 。 
16. 使 用 Li = > 。 则 对 于 任意 的 L,，L,UL, = "都 是 正则 的 ， 于 是 由 题 述 可 知 所 有 的 都 是 正则 的 。 
18. 我 们 可 以 按 如 下 方式 构造 : 找到 一 个 状态 的 集合 P， 满 足 从 初始 顶点 到 P 中 的 任何 一 个 元 素 都 有 


一 条 路 径 ， 并 且 从 P 中 任 一 元 素 到 终 态 也 有 一 条 路 径 。 然 后 将 P 中 的 每 一 个 元 素 都 改 为 终 态 。 
并 且 


26. 设 C = (Vi,T, 3 PD，G2 = (Vi, T, 5,, P,)， 不 失 一 般 性 地 ， 设 Vi 和 V; 是 不 相交 的 。 合 并 两 个 文法 
(a) 将 5 作为 新 的 开始 符 ， 并 添加 产生 式 S 一 51|S,。 
(b) 将 Pi 中 所 有 形 如 4->x (AEV,，xET") 的 产生 式 都 替换 为 4->x5,。 


(c) 将 P! 中 所 有 形 如 A 一 x (AEV,，xET") 的 产生 式 都 替换 为 4 一 x5,。 
4.2 


1. 根据 例 4.1 可 知 ，Li -是 正则 的 ， 所 以 存在 一 个 成 员 资 格 判 定 算法 。 


2. 如 果 卫 S 蕊 ， 则 LiNL = L,。 因 为 LiULs 是 正则 的 ， 并 且 我 们 有 判断 集合 相等 的 算法 ， 也 有 判断 
集合 之 间 包 含 关 系 的 算法 。 


5. 从 接受 L 的 dfa 出 发 ， 利 用 定理 4.2 中 的 方法 构造 接受 L* 的 dfa。 然 后 利用 定理 4.7 中 判断 等 价 性 的 
算法 。 


12. 本 题 需要 一 点 技巧 。 如 果 L 不 包含 长 度 为 偶数 的 符号 申 ， 则 


LNL(aa +ab+ ba+bb))=@ 
左边 是 正则 的 ， 因 此 我 们 可 以 应 用 定理 4.6。 


4.3 


串 的 可 接受 性 。 


2. 接受 L 的 dfa 要 处 理 中 间 的 符号 曲 "， 则 在 转换 图 中 需要 有 -条 长 度 为 | 的 通道 。 如 果 |v| 比 dfa 的 状 
态 数 大 ， 则 此 通道 中 必 包 含 一 个 标记 为 ) 的 回路 。 但 显然 ， 此 回路 可 以 被 重复 任意 多 次 而 不 改变 对 输入 


4. (a) 给 定 m， 选 w = a"b"a”。 于 是 符号 串 y 一 定 是 at+， 被 抽取 的 符号 捉 将 是 
Wi = a™ + GD 


如 果 取 i> 2， 则 m+ (i 一 Dk>m， 则 w 不 在 L 中 。 


(e) 直接 应 用 泵 引 理 似乎 不 太 容 易 ， 因 此 我 们 采取 间接 的 方法 。 假设 LL 是 正则 的 ， 则 根据 正则 语言 
在 补 运算 下 的 封闭 性 ， 工 也 将 是 正则 的 .。 但 = {fw : nw) = jw(w)}， 显然 不 是 正则 的 。 根 据 反 证 法 ，L 
不 是 正则 的 。 


5，(a) 取 p 为 大 于 等 于 m 的 最 小 质数 ， 选 w = ar。 于 是 y 是 由 a 构成 的 长 度 为 的 符号 趾 ， 因此 
Wi = a? + (Dk 


如 果 取 i 一 1 =p， 则 p + (i 一 Dk=p(k+1) 是 合 数 ， w+ 不 在 此 语言 中 





8. 此 命题 是 不 成 立 的 。 举 一 个 反例 ， 设 L = {a"b" ;nn<m}，L = {a"b" :n>m}， 两 个 都 是 非 正则 的 
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但 LUL = La) 却 是 正则 的 。 

9，(a) 此 语言 是 正则 的 。 通 过 分 情况 讨论 ， 可 以 很 容易 地 看 到 这 一 点 ， 如 ! = 0, k= 0, n>5, 在 
此 基础 上 可 以 很 容易 地 建立 正则 表达 式 。 

(b) 此 语言 不 是 正则 的 。 如 果 我 们 选 w = aaaaaab"a”"， 我 们 的 对 手 会 有 几 种 选择 。 如 果 y 只 包含 a， 
我 们 用 i = 0 来 破坏 n > 5 的 条 件 。 如 果 对 手 选 择 由 5 构成 的 y， 则 我 们 可 以 破坏 Xk < ! 的 条 件 。 

11. 工 是 正则 的 。 我 们 可 以 通过 L = LiNLA 以 及 已 知 的 正则 语言 在 相关 运算 下 的 封闭 性 得 到 此 结论 。 

13. (a) 此 语言 是 正则 的 ， 因 为 任何 一 个 包含 两 个 连续 的 相同 符号 的 符号 串 都 在 此 语言 中 。L 的 正 
则 表达 式 是 (a + pb)(a + b)'(aa + bb)(a + b)(a + b)’。 

(b) 此 语言 不 是 正则 的 。 取 w = (ab)”aa(ba)"， 此 时 对 手 有 儿 种 选择 ， 比 如 y = (ab)* 或 y = (ab)ta。 在 
第 一 种 情况 中 


wo = (ab)” taa(bay” 


因为 唯一 可 能 与 之 相等 的 就 是 ww* = biaab'， 所 以 wo 不 在 L 中 。 在 第 二 种 情况 中 ，wo 的 长 度 是 奇数 ， 因 此 
也 不 会 在 L 中 。 
15. 取 L; = a'b', i = 0, 1,…。 对 于 每 一 个 i,，L 上 都 是 有 穷 的 ， 因 此 也 是 正则 的 。 但 所 有 这 些 语 言 的 并 是 
非 正 则 语言 L = {a"b" : n>0}。 
17. 不 是 。 举 一 个 反例 ， 取 语言 
L = {vu :|=dU we :人 < 人 六 = 0.12,… 


我 们 断言 所 有 ZL; 的 并 是 集合 {tww"}。 为 了 证 明 这 一 点 ， 取 任意 符号 串 z = ww*， 其 中 |w| = n。 车 n>i， 则 
zEfva :|v|= 丫 ， 于 是 z 在 LL 中。 如 果 n < 六 则 zEfvva :< 人 ,= {0,1,2,…}， 于 是 z 也 在 LL 中。 因此 ， 
z 在 所 有 上 的 并 中 。 

另 一 方面 ， 任 取 乙 中 长 为 首 的 符号 串 z， 若 取 ; 关 于 严 ， 则 z 不 会 在 {wav& : lvi| = 让 中 ， 因 为 z 不 够 长 。 
于 是 z 一 定 在 {vw : vi < 站 中 ， 因 此 z 的 形式 必 为 ww*。 

最 后 我 们 还 必须 证 明 对 于 每 一 个 i，L 是 正则 的 。 可 以 根据 如 下 事实 得 证 : 对 于 每 一 个 i:， 只 有 有 限 
多 个 子 串 w。 
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4. 显然 ， 由 此 文法 产生 的 任何 一 个 符号 串 都 包含 相同 个 数 的 < 和 2。 为 了 证 明 前 缀 条 件 mm() > ns(v) 
成 立 ， 我 们 对 推导 过 程 的 长 度 进行 归纳 证 明 。 假 设 对 于 任何 一 个 由 5 在 n 步 中 产生 的 句 型 此 条 件 都 成 立 。 
要 在 n + 1 步 内 得 到 一 个 名 型， 我 们 可 以 应 用 产生 式 S 一 4 或 5->55。 因 为 这 两 个 产生 式 都 不 会 改变 a 和 4b 的 
个 数 ， 也 不 会 改变 已 经 产生 的 a 和 b 的 位 置 ， 所 以 前 组 条 件 依然 成 立 。 或 者 我 们 使 用 产生 式 S->aSb， 它 增 
加 了 -个 a 和 一 个 b。 但 因为 增加 的 a 是 在 增加 的 5 的 左边 ， 前 级 条 件 也 是 成 立 的 。 因 此 ， 若 在 n 步 后 前 绿 
条 件 成 立 ， 则 在 4 + 1 步 后 前 组 条 件 依然 成 立 。 显 然 ， 前 缀 条 件 在 一 步 后 是 成 立 的 ， 因 此 我 们 有 了 归纳 基 
础 ， 于 是 归纳 成 立 。 

7. (a) 首先 解决 4 = m + 3 的 情况 。 然 后 增加 更 多 的 p， 这 可 以 通过 下 列 产生 式 完 成 


S—aaaA 
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A—=aAblB 
B—BblA 


但 这 是 不 完整 的 ， 因 为 它 生 成 了 至 少 三 个 a。 为 了 解决 4 = 0, 1,2 的 情况 ， 我 们 添加 产生 式 
S—AlaAlaaA 


(d) 本 题 有 一 个 出 平 意料 的 简单 的 解 
S—aSbblaSbbb|A 


这 些 产 生 式 对 于 每 一 个 已 经 生成 的 a 非 确 定 地 产生 了 bb 或 bbb。 
8. (a) 对 于 第 一 种 情况 ，n = m，k 是 任意 的 ， 我 们 可 以 用 下 列 产生 式 


SS,=AC 
A—aAblA 
C—CclA 


在 第 二 种 情况 中 ，n 是 任意 的 ，m <k， 我 们 使 用 
人 2 三 BD 
B—aBlA 
D—bDc|E 
E—Ec|A 


最 后 ， 我 们 添加 产生 式 S->51|5,。 
(e) 将 问题 分 解 为 两 种 情况 ，n =k+m 和 m =k+n。 用 下 列 产生 式 处 理 第 一 种 情况 


S—asSc|Si|A 
Si—asiblA 


12. (a) 如 果 5 产 生 L， 则 S$. 一 SS 产生 L?。 
15. 通常 情况 下 不 能 由 的 文法 直接 得 出 工 的 文法 ， 因 此 我 们 希望 能 够 通过 一 种 递归 的 方式 描述 工 。 
这 一 点 在 现在 看 来 还 有 点 难 。 工 的 一 个 显而易见 的 子 集 包括 长 度 为 奇数 的 符号 申 ， 但 这 不 是 全 部 的 。 
假设 我 们 有 一 个 长 度 为 偶数 的 符号 串 ， 且 不 具有 形式 ww&。 我 们 从 中 间 开 始 同时 向 左 和 向 右 对 比 相 
应 的 符号 ， 当 中 点 附近 的 子 串 形 如 ww 时 ， 我 们 找到 了 左边 的 一 个 as 和 右边 相应 位 置 上 的 一 个 5， 或 者 与 
此 相反 。 于 是 此 符号 串 的 形式 必 为 aewwspv 或 mbwwsav， 其 中 四 | = |v|。 一 旦 我 们 认识 到 这 一 点 ， 我 们 就 
可 以 构造 产生 此 类 符号 串 的 文法 了 。 一 个 解 是 
S—ASAIB 
A~—alb 
B~—bCalaCb 
CaCalbCblA 
前 两 个 产生 式 生 成 u 和 v， 第 三 个 生成 两 个 不 同 的 符号 ， 最 后 一 个 生成 中 间 的 回 文 。 
19. 唯一 可 能 的 推导 始 于 


S—aaB—aaAa=>aabBba=»aabAaba 
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但 这 个 句 型 的 后 组 是 aba， 因 此 它 不 能 生成 句子 aabbabba，。 
22. E>E + ElE.EIE'I(P)IAG. 


5.2 


2. 一 个 解 是 
S—aA, A—>aABl|b, B—b 


注意 ， 另 一 个 较为 明显 的 文法 


SasiB 
SaSiB|A 
B—b 
不 是 简单 文法 。 
6.w = aab 有 两 个 最 左 推导 
S=—aaB=>aab 
S—AB=—AaB=>aaB=>aab 


9. 我 们 可 以 用 定理 3.4 中 的 方法 ， 从 一 个 接受 正则 语言 的 dfa 得 到 一 个 正则 文法 。 除去 4 一 和 ， 此 文法 
是 简单 文法 。 但 这 一 规则 不 会 产生 任何 二 义 性 ， 因 为 dfa 从 不 会 选择 ， 所 以 在 产生 式 中 也 不 会 有 选择 。 
14. 从 下 面 的 推导 中 可 以 清楚 地 看 到 二 义 性 
S=—>aSb=>ab 
S=>$$=—>abS=»ab 


一 个 等 价 的 非 二 义 性 文法 是 
S—A|A 


A—aAblab|A4 


此 文法 的 非 二 义 性 并 不 是 显而易见 的 。 为 了 使 其 可 信 ， 先 来 看 两 种 特殊 情况 ， 要 产生 w = aabb， 只 能 从 
产生 式 一 a4b 开 始 推导 ; 要 产生 w = abpap， 只 能 从 产生 式 4->44 开 始 推导 。 更 为 复杂 的 符号 串 也 都 包含 
在 这 两 种 情况 之 中 ， 所 以 产生 它们 的 方式 也 是 唯一 的 。 
20. 解 : 
S—aAlaAA 
A—bAblbb 
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3. 用 定理 6.1 对 第 一 个 文法 中 的 5 进行 替换 。 然 后 6 就 变 成 了 无 用 的 ， 其 相关 的 产生 式 便 可 以 被 删除 
了 。 由 定理 6.1 和 定理 6.2 可 知 ， 这 两 个 文法 是 等 价 的 。 
8. 唯一 的 可 空 变量 是 4， 因 此 消除 A 产生 式 ， 得 到 
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S—aAlalaBB 
A—aaAhlaa 
B—bClbbC 
C—B 


C 一 8 是 唯一 的 单位 产生 式 ， 消 除 它 得 到 


S—aAlalaBB 
A—aaAlaa 
B—>bC|bbC 
C—bC|bbC 


最 后 ，B 和 C 是 无 用 变量 了 ， 所 以 去 除 它们 可 以 得 到 
S—>aAla 
4 一 ad4|aa 
此 文法 生成 的 语言 是 L((aa)'a)。 
14. 一 个 例子 是 


S—aA 
A—BB 
B—>aBb|A 


消除 4 产生 式 以 后 ， 我 们 可 以 得 到 


S~>aAla 
A—BBIB 
B—aBblab 


16. 显然 是 这 样 的 。 因 为 删除 无 用 产生 式 后 ， 文 法 不 会 增加 任何 内 容 。 
21. 文法 S$->ah; Aq 没有 无 用 产生 式 ， 也 没有 单位 产生 式 或 是 4 产生 式 。 但 它 并 不 是 最 小 的 ， 因 为 
3 一 aa 与 其 等 价 。 


6.2 


5. 首先 我 们 必须 消除 4 产生 式 ， 得 到 


S—ABIB|aB 
A~*aab 


B—bbAlbb 
这 引入 了 一 个 单位 产生 式 ， 不 符合 定理 6.6 构 造 过 程 的 要 求 。 消除 这 个 单位 产生 式 很 简单 ， 得 到 


S—AB|bbAlaBlbb 
A—aab 
B—>bbAlbb 
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我 们 现在 可 以 应 用 定理 6.6 的 构造 过 程 ， 得 到 
S—AB|IV,V,AIV.BIV,V, 
A—V.V,V, 
B—V,V,AlV,V, 


S—»AB|V.A|V,B|V,V, 
A—» VV, 
B—V.A|V,V, 
V.—>V,V, 

Ve>V,V, 

V.—a 


Vb 


8. 考虑 线性 文法 中 产生 式 的 一 般 形式 
A—aia,…a,Bbb,…b, 


然后 引入 新 的 变量 Vi 及 产生 式 
-aa 


4 一 01V 


继续 这 一 过 程 ， 引 入 VY, 和 
Va3a Bbib, nb, 


依 此 类 推 , 直到 左边 不 再 含有 终结 符 。 然 后 用 类 似 的 方法 去 掉 右 边 的 终结 符 。 
9., 此 范式 可 以 很 容易 地 由 CNF 得 到 。 形 如 A 一 BC 的 产生 式 是 被 允许 的 ， 因 为 a = 和 是 可 能 的 。 对 于 
A 一 a，3 引 入 新 的 变量 V,/、V, 及 产生 式 4 一 aViV,、Vi 一 和 和 V, 一 4。 
12. 解 : SaVlaS|aV,S, V,—>a, V,—b。 
15. 只 有 4 一 b4B8C 不 具有 我 们 要 求 的 形式 ， 因 此 我 们 引入 4 一 bpAV 和 VBC。 后 者 的 形式 不 正确 ， 但 
经 过 对 8 的 替换 后 ， 我 们 有 
9 一 0S4 
A—bAV 
VbC 
C-~>a5C 


6.3 


2. 因为 aab 是 例 6.11 中 符号 申 的 前 级 ， 我 们 可 以 利用 在 那里 计算 出 来 的 Vj。 由 于 SEV,s， 所 以 符号 申 
aab 在 此 文法 产生 的 语言 中 ， 因 此 我 们 可 以 对 其 进行 语 革 分 析 。 
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为 了 做 语法 分 析 ， 我 们 要 确定 在 证 明 SEYs 中 用 到 的 产生 式 : 


SEV3， 因 为 8S 一 4 有 8， 其 中 4EV ,BEV 
AEVi;， 因 为 4 一 a 
BEV,;， 因 为 BA4B， 其 中 AEV,,, BEV,;s 
AEV,,， 因 为 4 一 a 
BEV;3， 因 为 B=>b 


上 述 产 生 式 证 明了 SEV';， 于 是 我 们 可 以 将 它们 用 于 语法 分 析 


S=>AB=>aB=—>ahAB=>aaB=>aab 


第 7 章 
7.1 


2. 证 明 的 关键 是 从 %o 到 9, 的 非 确定 性 的 转换 ， 此 转换 不 需要 在 符号 串 的 中 间 发 生 。 当 然 ， 如 果 转 换 
在 其 他 位 置 发 生 或 者 输入 的 符号 串 的 形式 不 是 wws， 自 动机 就 不 能 进入 接受 格局 。 假 设 转换 发 生 时 栈 的 
内 容 是 xix,…xiz， 自 动机 车 要 接受 一 个 符号 串 则 必须 进入 格局 (gi, 4, z)。 我 们 通过 检查 转移 函数 知道 ， 
我 们 可 以 进入 上 述 格局 当 且 仅 当 符号 电 的 未 读 部 分 形 如 xjx,…x.， 即 原 输入 形 如 ww*， 且 此 转换 正好 发 生 
在 符号 串 的 中 间 。 

4. (a) 可 以 这 样 得 到 解 : 每 读 入 一 个 a 向 栈 中 放 两 个 标志 ， 每 读 入 一 个 5 则 从 栈 中 去 掉 一 个 标志 。 
解 : 


6(qo 4, 7) = {(qgp, z)} 
(qo, a, z) = {(q1, 11z)} 
Kg 1,4,1) = {(gq 111)} 
gi, b, 1) = {(gqi, 4)} 
qi, 4, z) = {(qp, 2)} 


(f) 此 处 我 们 利用 非 确定 性 及 下 述 函 数 来 生成 一 个 、 两 个 或 三 个 符号 


Hgo, a, z) = {(q1, 12), (qi, 112), (qi, 111z)} 
6(q1, a, 1) 三 {(qi, 11), (gi, 111), (qi, 1111)} 


解 的 其 余部 分 基本 上 与 4 (a) 类 似 。 
9. 这 是 一 个 没有 用 栈 的 pda， 所 以 从 功能 上 讲 ， 它 等 同 于 一 个 有 穷 接 受 器 。 于 是 由 此 pda 可 以 直接 得 
到 状态 转换 


qo, a) = g) 
dqo, b) = go 
qi, 9) = 9g 
qi, b) = go 
11. 跟踪 此 过 程 ， 每 次 选择 一 条 路 径 。 从 go 到 9, 的 路 径 上 可 以 只 包含 一 个 a。 其 他 路 径 还 可 以 包括 一 
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个 a 后 面 跟随 一 个 或 多 个 b 并 以 a 结尾 。 这 些 是 全 部 的 ( 仅 有 的 ) 选择 。 所 以 此 pda 接受 语言 
L= {a}UL(abb’a) 


14. 我 们 没有 足够 的 状态 用 于 跟踪 < 的 序列 到 8 的 序列 的 转换 。 为 了 解决 这 个 问题 ， 我 们 在 栈 中 放 一 
个 符号 以 记录 我 们 在 符号 串 序 列 中 所 处 的 位 置 。 例 如 ， 一 个 解 是 : 


(qo, a, z) = {(go, 1)} 
6(qo, a, 1) = {(qo, 1)} 
6(qo, b, 1) = {(g0, 2)} 
qo, a, 2) = {(qo, 2)} 
(qo, 4, 2) = {(qr 2)} 


我 们 只 有 两 个 状态 ， 初 态 go 和 接受 状态 gr。 因 此， 我 们 一 般 不 再 需要 用 不 同 的 状态 进行 跟踪 ， 而 只 需要 
用 栈 中 的 一 个 符号 。 
16. 此 处 我 们 用 内 部 状态 记录 即将 被 放 人 栈 中 的 符号 。 例 如 ， 


069， 和， b) 三 {(g;, cde)} 


0(qi a, b) = {(gj, de)} 
gi., 4, d) = {(gq;, cd)} 


取代 。 由 于 6 只 能 有 有 限 个 元 素 ， 且 每 个 元 素 只 能 向 栈 中 添加 有 限 的 信息 ， 因 而 这 一 构造 过 程 可 以 被 任 
何 pda 完成 。 


7.2 


3. 可 以 仿照 定理 7.1 中 的 构造 过 程 ， 或 者 注意 到 此 语言 正 是 {a" 2b2*+1:m>0}。 通 过 后 者 我 们 得 到 如 
下 解 
(qo, a, z) = {(q1, 7)} 
(qi, a, 2) = {(q,, 2)} 
dq2, a, 2) = {(q,, 11z)} 
gq,, a, 1) = {(g,, 111)} 
oq, b, 1) = {(gq;, 1)} 
Gg;, b, 1) = {(q;, 1)} 
qs, 4, z) = {(qp, 2)} 
其 中 qo 是 初 态 ，4q/ 是 终 态 。 


4. 首先 将 文法 转换 为 格 里 巴克 范式 ， 得 到 5 一 aSSS; S-aB; Bb。 然 后 按照 定理 7.1 中 的 构造 过 程 进 
行 ， 得 到 


(go, A, z) 三 {(g, Sz)} 
gi, a, $) 三 {《(9b $55), 《91， B)} 
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(gq1,b,B) = {(qi, 4)} 
6(q A, z) = {(gq,, z)} 


7. 由 定理 7.2， 任 给 一 个 npda， 我 们 都 能 构造 一 个 等 价 的 上 下 文 无 关 文法 。 然 后 根据 定理 7.1， 我 
们 可 以 由 此 文法 构造 一 个 具有 三 状态 的 npda。 由 等 价 关系 的 传递 性 ， 初 始 的 npda 和 最 后 的 npda 也 是 等 
价 的 。 
9. 首先 我 们 得 到 ZL 的 格 里 巴克 范式 ， 例 如 5->a$Blb, Bp。 然后 ， 我 们 应 用 定理 7.1 中 的 构造 过 程 得 
到 一 个 具有 三 个 状态 49。、91 和 gq/ 的 npda。 我 们 可 以 通过 用 一 个 特殊 的 栈 符 号 标记 状态 q, 从 而 将 gq 省 去 。 一 
个 完整 的 解 是 
qo, A, z) = {(qo, Sz1)} 
(qo, a, S) = {(gqo, $B)} 
(qo, b, §) = {(qo, A)} 
oqo, b, B) = {(qo, 4)} 
(qo, 4, 21) = {(qy, A)} 


11. 开始 必须 至 少 有 一 个 a。 在 此 之 后 ，6(gqo, a, 4) = {(qo, 4)} 只 是 简单 地 读 入 a 而 不 改变 栈 的 内 容 。 
最 后 ， 当 遇 到 第 一 个 58 时，pda 进 入 状态 9 ， 而 从 此 状态 只 能 通过 1 转换 进入 终 态 。 因 此 ， 一 个 符号 种 可 
以 被 接受 当 且 仅 当 它 包含 一 个 或 多 个 a 并 且 以 一 个 8 结尾 。 


7.3 


4. 乍 一 看 ， 此 语言 似乎 是 非 确定 型 的 ， 因 为 前 级 a 可 以 连接 两 种 不 同 的 后 级 。 然 而 ， 此 语言 确实 是 
确定 型 的 ， 因 为 我 们 能 够 由 其 构造 一 个 dpda。 当 输入 的 第 一 个 符号 是 sa 时 ， 此 dpda 进 入 终 态 。 如 果 有 更 
多 的 输入 符号 ， 则 离开 此 状态 并 接受 arb"。 完 整 的 解 : 


(qo, a, z) = {(q;, 1z))} 
gs, a, 1) = {(g1, 11)} 
(gi, a.1) = {(g,, 11)} 
qi1, b, 1) = {(g1, A)} 
(qi, 4, z) = {(q2, 2)} 


这 里 FF = {9;, 93}。 

9. 可 以 很 直接 地 得 到 解 。 将 a 和 b 压 入 栈 中 。 符号 c 标 志 着 从 保存 到 匹配 的 转换 ， 因 此 所 有 过 程 都 可 
以 确定 性 地 进行 。 

11. 有 两 个 状态 : 初始 的 、 非 接受 状态 go 及 终 态 9,。pda 会 保持 在 状态 9, 上 直到 栈 顶 为 z。 当 栈 顶 为 
z 时 ，pda 将 转换 到 状态 go。 其 余部 分 基本 上 与 例 7.3 相 同 。 于 是 我 们 有 6(go, a, z) = {(q, 0z)}, 5(qi, a, 0) = 
{(41, 00)} 等 等 ， 其 中 56(q1, 4, z) = {(4o, z)}。 当 你 写 出 全 部 上 述 产生 式 时 ， 你 将 会 认识 到 此 pda 是 确定 
型 的 。 

15. 这 是 很 明显 的 。 因 为 任何 一 个 正则 语言 都 可 以 被 一 个 dfa 所 接受 ， 并 且 每 一 个 这 样 的 dfa 都 是 一 
个 没有 用 到 栈 的 dpda。 

16. 此 处 的 基本 思想 是 将 一 个 dpda 与 一 个 dfa 结 合 到 定理 4.1 的 构造 过 程 中 ， 而 对 栈 的 处 理 与 此 自动 
机 接受 语言 志 时 相同 。 不 难看 出 ， 结 果 是 一 个 dpda。. 
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7.4 


2. 考虑 符号 串 aabb 和 aabbbbaa。 在 前 者 中 ， 推 导 必须 由 S$ 二 a5B8 开 始 ; 而 在 后 者 中 ， 推 导 必 须 由 
5=>$5 开 始 。 但 如 果 我 们 仅 看 前 4 个 符号 ， 我 们 不 能 确定 是 哪 一 种 情况 。 于 是 此 文法 不 在 LL(4) 中 。 因 为 
对 于 任意 长 的 符号 串 ， 我 们 都 可 以 构造 类 似 上 面 的 例子 ， 所 以 对 于 任意 的 E， 此 文法 都 不 在 LL( 中 。 

4. 观察 前 三 个 符号 。 如 果 它 们 是 aaa、aab 或 4ba， 则 此 符号 串 只 能 在 L(a'ba) 中 。 如 果 前 三 个 符号 是 
abb， 则 任何 这 样 的 可 分 析 的 符号 串 都 一 定 在 L(abbb") 中 。 对 于 每 一 种 情况 ， 我 们 都 可 以 找到 一 个 LL 文 
法 ， 并 以 一 种 明显 的 方式 结合 二 者 。 一 个 解 是 

S—S1|5, 
Si—aSilba 
S.—abbB 
B—bB|A 


观察 前 三 个 字符 ， 我 们 就 可 以 知道 $=>5, 或 者 5=>5, 是 否 是 必需 的 。 所 以 此 文法 是 LL(3)。 
7. 对 于 一 个 确定 型 的 CFL， 存 在 一 个 dpda。 当 把 此 dpda 转 换 为 一 个 文法 时 ， 此 文法 是 非 二 义 性 的 。 
9, (a) | 
S—aSc|Si|A 
Si—bSic|A 


这 基本 上 是 一 个 简单 文法 。 只 要 当前 被 扫描 的 符号 是 4， 我 们 就 必须 应 用 5 一 aSc; 如 果 是 2， 就 必须 应 用 
5 一 $1; 如 果 是 c<， 则 只 能 用 5 一 入。 此 文法 是 LL(1)。 


第 8 章 
8.1 


3. 取 w = a"b"b"a"a"b"。 此 时 对 手 有 几 种 选择 可 以 考 虚 。 例 如 ， 若 v = a4，y = a， 且 v 和 y 位 于 前 组 a” 
中 ， 则 
wo = a™ -ipnrprara"p™ 


不 在 中 。 还 存在 许多 其 他 可 能 的 选择 ， 但 在 所 有 的 情况 下 ， 我 们 都 可 以 从 该 语言 中 抽取 出 这 个 符号 串 。 
7 (a) 用 泵 引 理 。 给 定 m， 取 w = om 如。 我 们 需要 仔细 考虑 的 wy 和) 的 选择 只 是 ， = ak y = bp'， 其 中 
与 /都 不 为 0。 设 ! = 1， 然 后 选 ; = 2 ， 于 是 wm 有 me +k 个 a 和 m + 1 个 65。 但 是 


(m+1)Y=m+2m+1 
>m?+k 


因为 w, 不 在 该 语言 中 ， 所 以 该 语言 不 是 上 下 文 无 关 的 。 可 类 似 地 证 明 /> 1 的 情况 。 

(f) 给 定 m， 取 w = a"b"*!c"*?， 则 可 以 很 容易 地 从 该 语言 中 抽取 出 w。 

8. (b) 该 语言 不 是 上 下 文 无 关 的 。 用 泵 引 理 ，w = a"b"a"b"， 并 检查 v 和 y 的 不 同 选择 。 

10. 可 能 出 平 你 的 意料 ， 该 语言 是 上 下 文 无 关 的 。 构 造 一 个 npda， 使 其 计数 到 菜 个 值 : (通过 将 k 个 
符号 放 入 栈 中 )， 并 记 住 第 k 个 符号 。 然 后 它 在 w, 中 检查 第 k 个 符号 。 如 果 该 符号 不 同 于 记 住 的 符号 ， 则 
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接受 该 符号 种 。 若 wEL， 则 必定 会 有 某 个 上 使 得 此 种 情况 发 生 。 该 npda 非 确定 性 地 选择 上 述 k。 
12. 使 用 线性 语言 的 泵 引 理 。 对 于 给 定 的 m， 选 取 w = ab "ae"。 现 在 "和 ?全 部 是 由 ae 构成 的 ， 因 此 可 
以 很 容易 地 从 该 语言 中 抽取 出 w。 
15. 该 语言 不 是 线性 的 。 用 泵 引 理 、 选 
w= (a)) + (a)…) 


其 中 《(…( 与 )…) 分 别 表示 m 个 左 括号 或 右 括号 。 如 果 |x| > 1， 则 我 们 可 以 很 容易 地 抽取 ， 使 得 对 于 某 个 
前 组 v，n((v)<n)(v) 是 一 个 不 正确 的 表达 式 。 可 以 类 似 地 证 明 其 他 的 分 解 方式 。 
20. 使 用 w = a”*， 其 中 p 和 gq 是 质数 且 p>>m，4q>>m。 如 果 |vy| =x， 则 


lwi,i|=pg+ik 


如 果 我 们 选 i = pqg， 则 


wir1 = aet1 +k) 
不 在 该 语言 中 。 
8.2 


1. 补 语言 是 上 下 文 无 关 的 。 补 语言 包括 两 种 情况 : mw)#m(w) 和 ns(w) 关 nl(w) 。 这 些 又 可 以 被 分 
解 为 nw)> nCw)，ns(w) > nc(w)，na(w) <no(w) 和 ns(w) <n.(w)。 其 中 每 一 个 都 是 上 下 文 无 关 的 ， 这 可 以 
通过 构造 一 个 CFG 得 到 证 明 。 因 此 ， 完 整 的 语言 是 上 述 四 种 情况 的 并 ， 根 据 并 运算 的 封闭 性 ， 该 语言 
上 下 文 无 关 的 。 . 

5. 给 定 一 个 上 下 文 无 关 文法 G， 通 过 将 每 一 个 产生 式 4 一 zx 替换 为 4-*xz 构 造 一 个 上 下 文 无 关 文法 @。 
对 推导 的 步骤 数 进 行 归纳 ， 我 们 可 以 证 明 ， 若 w 是 G 的 一 个 句 型 ， 则 ws 是 G 的 一 个 句 型。 

9. 给 定 两 个 线性 文法 @G = (V, T, $1, PD) 和 G， = (V,, 了 ， S$,, P,), 且 VmV = 分， 构造 二 者 合并 后 的 文 
法 G=(VUV,T,5,BRUBUS 一 515,)。 则 GG 是 线性 的 且 LG)= KGJULG)。 
为 了 证 明 线性 语言 在 连接 运算 下 是 不 封闭 的 ， 选 取 线 性 语言 L = {arb” : n> 1}， 则 可 以 通过 泵 引 理 证 明 语 
言 己 不 是 线性 的 。 

13. 设 C, = (Vi,T, 51, Pi) 是 二 的 一 个 线性 文法 ，G; = (W, T, 5,, Py) 是 的 一 个 左 线性 文法 。 通 过 把 
G; 中 形 如 V>x (xET) 的 产生 式 赫 换 为 y->5ix 来 构造 一 个 文法 忆 ,。 合并 文法 GI. 和信， 选取 5; 为 开始 符 。 
可 以 很 容易 地 证 明 ， 在 该 文法 中 


SS wuw 


当 且 仅 ee 月 wEL,。 
15. 语言 L, = {a"b"c"*} 和 L, = {a"b"c “7 都 是 非 二 义 性 的 。 但 它们 的 交 甚 至 不 是 上 下 文 无 关 的 。 
21. AEL(G) 当 且 仅 当 5 是 可 空 的 。 


第 9 章 
9.1 


2. 检查 整个 输入 的 一 个 具有 三 个 状态 的 解 是 
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6(qo, a) 三 (gi, a, R) 
(qi1, a) = (qi, b) = (gi, a, 有) 
dqi, DD) = (gy, 口 ， R) 


其 中 严 = {q2}。 
还 可 以 通过 只 检查 输入 的 第 一 个 符号 而 忽略 其 余 输入 符号 来 得 到 一 个 具有 两 个 状态 的 解 ， 例 如 


6(go, a) 一 (gq;, a, R) 
7. (a) 


6(qo, a) = (qi1, a, R) 
6(q1, b) = (gq,, b, R) 
(gq,, a) = (q,, a, R) 
6(q,, b) = (q;, b, R) 


其 中 F = {q3}。 
(b) 
0(q， a) 三 6(qo, b) 二 (qi, Dj, R) “ 
(go, Dj) 三 (q2>， 0, R) 
qi, a) = (gq1, b) = (go, DD, R) 


其 中 F = {9,}。 ; 

10. 在 概念 上 ， 本 题 的 解 是 简单 的 ， 但 要 写 出 细节 不 免 有 些 元 长 。 大 致 结 构 如 下 : 

(i 在 每 一 个 符号 串 的 末尾 放置 一 个 标记 符号 c。 

(iD 将 左边 的 两 个 符号 的 组 合 ca 替换 为 ac， 将 右边 的 两 个 符号 的 组 合 ac 替换 为 ce。 重 复 此 过 程 ， 直 
到 两 个 c 在 符号 串 的 中 间 相 遇 。 

(iiD 去 掉 一 个 c 并 移动 符号 串 的 其 余部 分 将 空位 补 上 。 

显然 ， 这 是 一 个 很 长 的 过 程 ， 但 它 却 是 图 灵机 经 常 以 一 种 笨拙 的 方式 做 一 些 简 单 的 工作 这 一 事实 的 
典型 情况 。 

12. 我 们 不 能 只 从 一 个 方向 查找 ， 因 为 我 们 不 知道 何 时 能 停 下 来 。 我 们 必须 以 一 种 往返 的 方式 工作 ， 
将 标志 置 于 查找 区 间 的 右边 界 和 左边 界 ， 并 向 外 移动 标记 。 

19. 如 果 终 态 集 F 包 含 的 元 素 多 于 一 个 ， 则 对 于 所 有 的 gEP 和 coET， 可 以 引入 一 个 新 的 终 态 4 及 转换 


(4， a) = (gp, a, R) 
9.2 


3. (a) 我 们 可 以 将 该 机 器 视 为 由 两 个 主要 部 分 构成 的 : 一 个 只 对 输入 加 1 的 加 1 器 ; 一 个 将 两 个 数 
相 乘 的 乘法 器 。 示 意 性 地 它们 以 一 种 简单 的 方式 结合 。 
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5.(c) 首先 ， 将 输入 分 解 为 两 个 相等 的 部 分 。 这 可 以 仿照 9.1 节 的 习题 10 进 行 。 然 后 按 硕 序 比较 一 
个 部 分 中 的 一 个 符号 和 另 一 个 部 分 中 与 其 对 应 的 符号 ， 直 到 发 现 不 间 的 两 个 符号 。 
8. 一 个 解 : 
dqo, a) = (qi, a, R) 
6(qo, c) = (go, c, R) 对 所 有 的 cEY - {a} 
dqo, DD) = (gq), DD, R) 


状态 qo 是 可 以 应 用 searchright 指 令 的 任何 一 个 状态 。 
9.3 


2. 我 们 忽略 了 到 目前 为 止 定义 的 图 灵机 是 确定 型 的 ， 而 pda 可 以 是 非 确定 型 的 这 一 事实 。 因 此 ， 我 
们 还 不 能 断言 图 灵机 比 下 推 自动 机 更 强大 。 


第 10 章 
10.1 


4. (a) 该 自动 机 有 一 个 转移 函数 
6:QxT—>QxTx{L,R,S} 


其 中 限制 : 对 于 所 有 的 转换 5(q,, a) = (qh b, Lor R)， 条 件 a = b 必 须 成 立 。 

(b) 为 了 模拟 标准 图 灵机 的 转换 6(g,, a) = (gq,, b, L)， 其 中 a#*b， 对 于 所 有 的 cET， 我 们 引入 新 的 转 
换 6(q,, a) = (gj, 5b,5) 和 6(qj, 5) = (gq,, b,L)， 等 等 。 

6. 我 们 引入 一 个 伪 空 白 符 (pseudo-blank) B。 每 当 原 机 器 要 写 口 时 ， 新 的 机 器 就 写 B。 因 此 ， 对 于 
每 一 个 6(q, 口 ) = (qj, 5, )， 我 们 增加 6(q,, B) = (qj, b, L)， 竺 等。 当然， 我 们 应 该 保留 原来 的 转换 5g， 
口 ) = (gq;, b, 站 以 处 理 带 上 原 有 的 空白 符 。 

9. 这 不 会 限制 自动 机 的 能 力 。 对 于 每 一 个 符号 aET， 我 们 引入 一 个 伪 符 号 (pseudo-symbol)， 比 如 
说 4。 每 当 我 们 需要 保留 4 时 ， 我 们 先 写 下 4， 然 后 回 到 该 单元 ， 将 4 替换 为 a。 

11. 对 于 所 有 的 deTr - {a, 6b}， 我 们 将 


0(9,， {a， b}) = (9)， C， Rk) 
替换 为 
0(G，， d) 二 (gj, C， R) 


10.2 


1. 为 了 给 出 形式 化 的 定义 ,我们 使 用 Fr = TxTx…xT 和 5: OQ xT 了 一 Ox Tx {L, R}"， 这 里 m 是 读 
写 头 的 个 数 。 一 个 需要 考虑 的 问题 是 当 两 个 读 写 头 位 于 同一 个 单元 时 会 发 生 什么 情况 。 形 式 化 的 定义 必 
须 给 出 可 能 发 生 的 冲突 的 解决 方案 。 

要 用 标准 图 灵机 (SM) 模拟 原 图 灵机 (OM)， 我 们 让 SM 具有 m + 1 个 道 。 在 一 个 道上 我 们 保存 OM 
带 上 的 内 容 ， 而 我 们 用 其 余 的 m 个 道 记录 OM 的 带头 的 位 置 。 
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SM 通过 扫描 并 更 新 它 的 活动 区 来 模拟 OM 的 每 一 个 迁移 。 
4. 本 练习 说 明了 队列 自动 机 与 标准 图 灵机 是 等 价 的 ， 因 此 ， 队 列 是 比 栈 更 强大 的 存储 设备 。 要 用 队 
列 自动 机 模拟 标准 图 灵机 ， 我 们 可 以 将 OM 的 右 侧 保持 在 队列 的 前 面 ， 将 左 侧 保持 在 队列 的 后 面 。 


读 写 头 


TT TT 
TT TT 


对 右 移 的 模拟 很 简单 ， 我 们 只 需 去 掉队 列 的 首 符号 并 将 相应 符号 置 于 队列 尾部 。 而 对 左 移 的 模拟 是 相对 
复杂 的 ， 我 们 需要 让 队列 的 内 容 循 环 移动 几 次 以 使 得 所 有 符号 都 在 正确 的 位 置 上 。 我 们 可 以 借助 于 另外 
的 标记 7 和 2Z 来 表示 边界 。 例 如 ， 为 了 模拟 


6(qc) = (gq;, z, L) 


我 们 执行 下 列 步 又: 

(GD 去 掉队 列 首 符号 <， 将 zY 添 加 到 队列 尾部 。 

(ii) 循环 队列 中 的 内 容 直 到 得 到 bzYdefgXa。 

(iii) 将 Z 添 加 至 队列 尾部 ， 然 后 循环 ， 当 7 和 Z 移 至 队列 首部 时 将 其 去 掉 。 

8. 我 们 只 需 两 个 带 ， 一 个 用 于 存储 OM 的 带 内 容 ， 另 一 个 用 于 存储 OM 的 状态 。 


9i 
TT TT ow 
qo 
| :el .| 


SM 的 格局 
ol | 


SM 只 需要 两 个 状态 :一 个 接受 状态 和 一 个 非 接受 状态 。 
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10.3 


3.(i) 从 输入 的 左 侧 开 始 。 通 过 将 机 器 置 于 相应 的 状态 来 记 住 符 号 。 然 后 将 其 替换 为 X。 

(将 读 写 头 右 移 ， 并 停 在 〈 非 确定 地 ) 输入 的 中 间 。 

《ii 比较 该 位 置 上 的 符号 与 记 住 的 符号 。 如 果 匹 配 ， 则 在 该 单元 上 写 Y。 如 果 不 匹配 ， 则 拒绝 输入 。 

(iv) 由 于 输入 的 中 间 用 y 敌 了 标记 ， 我 们 就 可 以 确定 地 进行 下 面 的 步 又: 交替 地 左 移 和 右 移 ， 比 较 相 
应 的 符号 。 

要 得 到 一 个 完全 确定 型 的 解 ， 我 们 首先 要 找到 输入 的 中 点 (比如 在 两 个 端点 置 标记 ， 然 后 将 其 移 疝 
中 间 ， 直 至 相遇 )。 

6. 非 确定 性 地 为 n 选 择 一 个 值 。 判 断 输 入 的 长 度 是 否 是 的 整数 倍 。 如 果 是 ， 则 接受 。 若 a"EL， 则 
存在 某 个 x 使 上 述 过 程 有 效 。 


10.4 


3. 大 致 算法 如 下 : 

Q) 首先 ， 拷贝 前 面 的 符号 串 。 

(ii 找到 最 右边 的 0 ， 将 其 改 为 1!。 然 后 将 这 个 1 右边 的 1 全 都 改 为 0。 

(ii 如 果 没 有 0 了 ， 则 将 所 有 的 1 改 为 0， 并 在 左 侧 添加 一 个 1。 

(iv) 转 到 (i)。 

8. 设 $1 = {51, 52,，…}，52 = {hy,…}， 则 它们 的 并 可 以 由 下 式 枚 举 
S1US, = {51, 11, $2, 12, ***} 


如 果菜 个 5; = 六 则 我 们 只 列 出 其 中 一 个 。 因 此 ， 上 述 两 个 集合 的 并 是 可 数 的 。 对 于 $, x S;， 使 用 图 10-17 
中 的 排序 


10.5 


2. 首先 ， 将 输入 除 以 2， 并 将 结果 移 至 带 的 一 个 部 分 上 ， 这 部 分 空白 空间 最 初 是 由 输入 占据 的 。 此 
部 分 空间 可 以 被 用 于 存储 后 续 的 除数 。 

4.(e) 使 用 如 下 图 所 示 的 3- 道 自动 机 。 在 第 三 道上 ， 我 们 保留 lw| 的 当前 试验 值 。 在 第 二 道上 ， 我 
们 每 隔 |w| 个 单元 放置 一 个 分 隔 符 。 然 后 我 们 比较 标记 之 间 的 单元 内 容 。 


分 隔 符 
jw| 的 试验 值 





6. 用 62 节 的 练习 16 找 到 一 个 I 型 (two-standard form) 文法 。 然后 使 用 定理 7.1 中 的 构造 过 程 。 由 此 
得 到 的 pda 每 一 次 迁移 读 入 一 个 输入 符号 ， 并 且 每 次 增加 的 栈 的 内 容 都 不 超过 一 个 符号 。 
7. 例 : 
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di 
:ov 


让 下 
栈 格局 
图 
时 
栈 1 栈 2 : 


栈 1 包含 OM 读 写 头 下 面 的 符号 及 其 左 侧 的 所 有 符号 。 栈 2 包含 读 写 头 右 侧 的 所 有 信息 。 对 OM 读 写 头 的 左 
移 和 右 移 的 模拟 都 很 简单 。 例 如 ， 要 模拟 6(q;, a) = (qj, 5, L)， 可 以 将 a 从 栈 1 弹 出 ， 并 将 b 压 入 栈 2。 


第 11 章 
11.1 


2. 我 们 知道 两 个 可 数 集合 的 并 还 是 可 数 的 ， 所 有 递归 可 枚 举 语 言 的 集合 是 可 数 的 。 如 果 所 有 非 递 归 
可 枚 举 的 语言 的 集合 也 是 可 数 的 ， 那 么 所 有 语言 的 集合 就 是 可 数 的 。 但 我 们 知道 ， 事 实 并 非 如 此 。 

6. 设 志 和 疡 是 两 个 递归 可 枚 举 语言 ，M, 和 1: 分 别 是 接受 这 两 个 语言 的 图 灵机 。 当 用 输入 w 表 示 时 ， 
我 们 非 确 定 地 选择 M1 或 M, 来 处 理 w。 结 果 是 一 个 接受 Li,UL, 的 图 灵机 。 

11. 因为 上 下 文 无 关 语言 是 递归 的 ， 所 以 由 定理 11.4 可 知 ， 该 语言 的 补 也 是 递归 的 。 但 应 该 注意 ， 
该 补 语言 并 不 一 定 是 上 下 文 无 关 的 。 

14. 对 于 任意 给 定 的 wEL'!， 考 虚 w 的 所 有 拆 分 w = wiw,…w,。 对 于 每 一 种 拆 分 ， 确 定 是否 有 wEL。 
因为 对 于 每 -一 个 w， 只 存在 有 限 个 拆 分 方式 ， 因 而 我 们 能 够 确定 是 否 有 wEL'。 

18. 试图 通过 对 角 线 化 证 明 2 是 不 可 数 的 (5 是 有 限 集 合 ) 之 所 以 失败 ， 是 因为 图 11-2 中 的 表 不 是 正 
方形 的 ， 它 有 |23 行 和 | 列 。 


|3| 列 


29 行 








当 我 们 对 角 化 时 ， 对 角 线 上 的 结果 可 能 出 现在 下 面 的 某 一 行 上 。 
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11.2 
1. 看 一 个 典型 的 推导 : 
S$ SaSibB=>aaSibbB >a’Sib"B=a' 'b" 1B=>a"* 1b"+ 1B=—… 
由 此 不 难 推测 出 该 文法 生成 语言 为 
L={arript n>1,k=-1,1,3,..} 
3. 形式 上 ， 读 文法 可 以 被 描述 为 G=(V, 5, 7, P)， 其 中 SC(VUT)*, 且 
L(G) = {xET :5 一 cx 对 于 任意 的 sES} 


定义 11.3 中 的 无 限制 文法 与 此 扩展 文法 是 等 价 的 ， 因 为 任 给 一 个 无 限制 文法 ， 对 于 所 有 sES， 我 们 总 可 
以 添加 开始 规则 So->s;。 
7. 为 了 得 到 无 限制 文法 的 这 种 形式 ， 每 当 |u| > |v| 时 ， 都 在 右 侧 插入 旺 变 量 (dummy variable)。 例 


如 : 
AB—C 
可 被 替换 为 
AB—CD 
D—A 
对 于 等 价 性 的 证 明 是 简单 的 。 
11.3 


1. (c) 处 理 上 下 文 相关 文法 并 不 总 是 容易 的 。 例 11.2 中 介绍 的 消息 传递 者 的 想法 通常 是 有 用 的 。 
在 此 问题 中 ,第 一 步 是 要 产生 句 型 8c"D。 变 量 B 和 DD 将 起 到 标记 和 消息 传递 者 的 作用 ， 以 保证 在 合适 的 
位 置 上 生成 正确 数目 的 5; 和 d。 第 一 部 分 用 如 下 产生 式 很 容易 得 到 


S—aAcDlaBcD 
4 一 a4claBc 


下 一 步 ， 将 8 向 右 移动 以 便 和 D 相 遇 ， 所 用 产生 式 为 


Bc—cB 
Bb—bB 


当 8 和 D 相 遇 了 时， 我 们 便 可 以 生成 一 个 4 和 一 个 返回 的 消息 传递 者 ， 该 消息 传递 者 将 在 正确 的 位 置 上 生成 
一 个 b 并 停止 于 该 位 置 。 


BD—Ed 
cE—Ec 
bE—=Eb 
aE—ab 
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另外 ， 我 们 也 可 以 生成 -个 4 和 一 个 标记 D， 并 用 一 个 不 同 的 消息 传递 者 生成 一 个 b，， 如 此 继续 下 去 : 


BD—>FDd 
CE 一 Frc 
bF—Fb 
aF—>abB 


4. 最 简单 的 证 明 来 自 于 lba。 假 设 一 个 语言 是 上 下 文 相关 的 ， 则 存在 一 个 lba M 能 够 接受 该 语言 。 给 
定 w， 我 们 先 将 其 重 写 为 w*， 然 后 再 将 M 作 用 于 它 。 因 为 L* = {w : wrEL}， 所 以 MM 接受 w* 当 且 仅 当 wEL*。 
将 符号 串 重 写 并 将 M 应 用 于 其 上 的 自动 机 是 一 个 lba。 因 此 Lf 是 上 下 文 相关 的 。 

6. 我 们 可 以 通过 lba 来 证 明 。 显 然 存在 一 个 lba 可 以 识别 任何 形 如 wuw 的 符号 串 。 只 需 从 另 一 端 开始 
比较 相应 的 符号 直到 得 到 一 个 匹配 的 符号 串 。 因 为 存在 一 个 Ilba， 所 以 该 语言 是 上 下 文 相 关 的 且 一 定 存在 
一 个 上 下 文 相关 文法 。 


第 12 章 
12.1 


3. 给 定 M 和 w, 修改 MM 从 而 得 到 扫 ， 必 停 机 当 且 仅 当 写 下 一 个 特殊 符号 (比如 一 个 新 引入 的 符号 #)。 
要 实现 这 点， 我 们 可 以 修改 M 的 停机 格局 使 得 每 次 写 下 # 后 便 停止 。 于 是 ，M 停 机 就 意味 着 应 写 下 了 #， 
而 4 写 下 了 # 就 意味 着 M 停 机 了 。 因此 ,如果 有 一 个 算法 可 以 告诉 我 们 自动 机 是 否 写 下 了 一 个 特殊 符号 a， 
我 们 就 可 以 令 a = # 并 将 其 作用 于 矿 。 这 就 解决 了 停机 问题 。 

7. 给 定 (M, w)， 将 M 修 改 为 契 ， 使 得 (4W, w) 停机 当 且 仅 当 应 接受 了 某 个 简单 语言 ， 比 如 {a}。 
为 了 达到 此 月 的 ，M 可 以 首先 检查 输入 并 记 住 其 是 否 是 4a。 然后 M 执 行 其 正常 的 计算 。 当 它 停机 时 ， 检 查 
输入 是 否 是 a。 如 果 是 则 接受 ， 否 则 就 拒绝 。 因 此 褒 接 受 {a} 当 且 仅 当 M 停 机 。 现 在 构造 一 个 接受 ea 的 简 
单 的 图 灵机 M,。 如 果 我 们 有 一 个 算法 能 够 检查 两 个 语言 的 等 价 性 ， 我 们 就 可 以 用 它 判断 是 否 志 应 ) = 
LM1)。 如 果 L( 诬 ) = LM)， 则 (M, w) 停机 。 如 果 L 用 ) 二 LM1)， 则 (M, w) 不 停机 ， 于 是 我 们 就 得 
到 了 停机 问题 的 解决 方案 。 

10. 给 定 (MM, w)， 我 们 修改 MM 使 其 在 格局 gw 下 总 是 停机 。 如 果 给 定 的 问题 是 可 判定 的 ， 我 们 就 可 
以 将 假定 的 算法 用 于 修改 后 的 具有 格局 gow 和 qev 的 机 器 。 这 样 我 们 就 得 到 了 停机 问题 的 -个 解决 方案 。 

13. 取 一 台 通 用 图 灵机 并 用 它 模 拟 空白 带 上 的 计算 。 一 旦 被 模拟 的 计算 停机 ， 通 用 图 灵机 就 楼 受 正 
在 被 模拟 的 图 灵机 。 因 而 此 通用 图 灵机 是 一 个 接受 器 ， 它 接受 所 有 在 空白 带 上 停机 的 图 灵机 。 于 是 该 集 
合 是 递归 可 枚 举 的 。 

现在 假设 该 集合 是 递归 的 ， 则 存在 一 个 算法 4， 该 算法 可 以 按 程序 长 度 的 递增 顺序 列举 出 所 有 在 空 
白带 上 停机 的 图 灵机 。 检 查 原 图 灵机 是 否 在 由 4 列举 出 的 图 灵机 之 中 。 因 为 原 程序 的 长 度 是 固定 的 ， 所 
以 当 被 检查 的 图 灵机 的 程序 长 度 超过 该 长 度 时 ， 比 较 将 会 停止 。 于 是 我 们 就 有 了 一 个 空白 带 停机 问题 的 
解决 方案 。 

16. 设 该 问题 的 实例 是 p,, p;, …,p,， 我 们 构造 一 个 图 灵机 使 其 按 如 下 方式 运行 : 

如 果 问题 = pi 则 返回 false 
如 果 问题 = p, 则 返回 true 
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如 果 问题 = p, 则 返回 true 
无 论 这 些 实例 的 真 值 如 何 ， 总 会 有 某 个 图 灵机 能 给 出 正确 的 答案 。 记 住 ， 我 们 无 须知 道 该 图 灵机 实际 是 
什么 样子 ， 只 需 保 证 它 存在 即 可 。 


12.2 


3. 假设 我 们 有 一 个 算法 能 够 判定 是 否 CMS L(M,)。 则 我 们 可 以 构造 一 个 图 灵机 M,， 满 足 L(M,) = 
多 ， 然 后 应 用 此 算法 。 于 是 LCM,)S L(M,) 当 且 仅 当 L(M1) = B。 但 这 与 定理 12.3 矛 盾 ， 因 为 我 们 可 以 由 任 
给 的 文法 G 构 造 M.。 

6. 如 果 我 们 取 L(G,) = Z ， 则 该 问题 就 变 成 了 定理 12.3 的 问题 ， 因 而 是 不 可 判定 的 。 

8. 因为 存在 ~ 些 文法 使 得 L(G) = L(G)"， 且 存在 另 一 些 文法 使 得 L(G) * L(G)， 所 以 由 Rice 定 理 可 知 
该 问题 是 不 可 判定 的 。 而 要 由 基本 原理 得 到 此 结果 会 比较 难 。 取 停机 问题 (M, w) 并 修改 之 (如 定理 
12.4 所 述 )， 使 得 如 果 (M, w) 停机 则 好 接 受 {a}"， 如 果 (M, w) 不 停机 则 府 接 受 G。 使 用 我 们 借以 得 
到 定理 11.7 的 构造 方法 来 由 帮 构 造 文法 G。 如 果 LY)={a) ， 则 LO = LO) ={a}。 但 如 果 LD =， 
则 LO) = 多 且 LG) = 他。 因此 ， 如 果 此 问题 是 可 判定 的 ， 我 们 就 可 以 得 到 停机 问题 的 个 解决 方案 。 


12.3 


1. 一 个 PC-solution 是 wawaw = wavi。 没 有 MPC-solution， 因 为 一 个 符号 串 的 前 缀 是 001 ， 另 一 个 符 
号 串 的 前 缀 是 01。 

3. 如 果 对 于 所 有 的 !， 都 有 |wi > |vi 或 者 都 有 |wi| < ly|， 那 么 显然 无 解 。 如 果 此 条 件 不 成 立 ， 则 要 人 么 
对 于 某 个 :有 |wi|=|vi|， 该 情况 下 的 解 是 显然 的 ， 要 么 存在 一 个 j 和 一 个 k， 满足 |wj|> vl 且 |ws| <|wl。 在 后 
一 种 情况 中 ， 波 斯 特 对 应 问题 有 一 个 解 wiw; ， 这 里 r = |v| ~ [wl，s = |wj| 一 vil。 

5. (a) 该 问题 是 不 可 判定 的 。 如 果 它 是 可 判定 的 ， 我 们 就 会 有 一 个 判定 原 修 改过 的 波斯 特 对 应 问 
题 (MPC-problem) 的 算法 。 给 定 wj w，…, w， 我 们 构造 wi,w#,…,w* 并 使 用 假定 算法 。 由 于 wiw,… 
wi= (wh wewe)®, 所 以 原 MPC-problem 有 解 当 且 仅 当 新 的 MPC-problem 有 解 。 


第 13 章 
13.1 


2. 使 用 例 13.3 中 的 函数 subtr， 我 们 得 到 解 


greater(x, y) = subtr(1, subtr (1, subtr (x, y))) 


8(X,y) = mult(x, g(x, y — 1)) 
g(x, 0)= 1 


A(l,y) = A(0, A(1,y ~ 1)) 
=A(l,y- D+1 
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=A(l,y-2)+2 


=A(1,0)+y 
=y+2 


(b) 有 了 (a) 的 结果 ， 我 们 可 以 用 归纳 法 证 明 下 一 个 等 式 。 假 设 对 于 y = 1, 2, …, n -1， 我 们 有 
4(27) = 2y+ 3。 则 
A(2,1) = A(1, 4(2, n — 1)) 

= A(l,2n+ 1) 

=2n+3， 由 (a) 
因为 

A(2,0) = A(1, 1) 

=3 


于 是 我 们 有 了 归纳 基础 ， 因 而 该 等 式 对 所 有 的 y 均 成 立 。 | 
15. 如 果 2*+y -3=0， 则 y = 3- 2*。 了 唯一 能 给 出 具有 正 值 的 的 x 的 值 是 0 和 1， 因 此 4 的 值 域 是 {0, 1} ， 
当 y = 1 时 取 最 小 值 。 因 此 


Wy(2° +y-3)=1 
13.2 


1.，(b) 使 用 Cr = {a, 5, c}, Cw = {Xx} 以 及 4 = {x}。 非 终结 符 x+ 被 用 作 目标 符号 申 的 左边 界 和 右边 界 ， 
两 个 w 由 下 式 同时 产生 
VixV,—ViaxValVibxV,b|VicxVc 


最 后 ，x 由 下 式 去 挤 


VX,—> VV, 
3. 在 每 一 步 唯一 可 能 的 对 V 的 识别 是 用 整个 生成 的 符号 申 。 这 导致 了 符号 捉 数目 的 加 倍 ， 且 
L={a”:n>1} 
5. 一 个 解 是 
Vi* V= VVl*V,= Vy, 
Vi* V= VV * Vl = VV, 
例如 


l*1 = 1=>11*1 = 11=>11*11 = 1111 


等 等 。 
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13.3 


Pi:S—5S, 

P,: Si>ad, S,>aS, 
P;: S\—bS, S,—bS, 
P,: 一 人 ,9 一 人 


5. 回忆 我 们 对 于 上 下 文 相关 文法 使 用 的 消息 传递 者 的 方法 ， 就 可 以 得 出 本 题 的 解 。 
ab—x 


Xb—bx 


XC 一 外 
8. 虽然 此 结果 不 是 显而易见 的 ， 但 它 却 是 解决 习题 7 的 一 个 方法 。 任 取 一 个 符号 串 ， 比 如 a25， 该 符 
号 串 可 以 通过 对 az 使 用 1 次 产生 式 a 一 aaa 以 及 126 次 产生 式 e->ae 而 得 到 。 而 <22 也 可 以 通过 类 似 的 方式 
由 oa 得 到 ， 等 等 。 因 此 L(aa") 中 的 每 一 个 符号 串 都 可 以 被 生成 。 
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索引 中 的 页 码 为 英文 原 书 的 页 码 ， 与 书 中 边栏 的 页 码 一 致 。 


A 


accepter (接受 器 )，26 

Ackerman's function (Ackerman 国 数 ) ，330 

algorithm (算法 )，2，246 

alphabet (字母 表 )，15 

ambiguity ( 一 义 性 )，136 
of a grammar (文法 的 )，141 
inherent (固有 的 )，144 

automaton (自动 机 )，2，25 
deterministic ( 依 定 型 的 }，26 
nondeterministic ( 非 确定 型 的 )，26 

axioms (公理 )，324，334 


B 


Backus-Naur form (巴克 斯 -诺尔 形式 )，146 

base of a cycle ( 回路 的 始点 )，8 

blank ( 空 自 符 )，223 

blank-tape halting problem (空白 带 停机 问题 ) ，305 


C 


Cartesian product of sets ( 集合 的 笛 卡 儿 积 )，5 
child-parent relation in a tree ( 树 中 的 父子 关系 )，8 
Chomsky hierarchy ( 乔 姆 斯 基层 次 结构 ) ，295 
Chomsky normal form ( 乔 姆 斯 基 范 式 )，149，165 
Church's thesis ( 丘 奇 论题 )，325 
Church-Turing thesis ( 丘 奇 -图 灵 论 题 )，325 
closure ( 闭 包 )，99 

positive ( 正 的 )，18 

star ( 星 )，18 
closure properties (封闭 性 质 ) 
of context-free languages (上 下 文 无 关 语 言 的 )，213 

of regular languages (正则 语言 的 )，100 
complement ( 补 ) 

of a set (集合 的 )，3 

of a language (语言 的 )，18 


complete systems (完整 系统 )，324 
complexity (复杂 性 )，343 
of a grammar (文法 的 )，163 
space (空间 )，344 
time (时 间 )，344 
complexity class P (复杂 性 类 P)，353 
complexity class NP (复杂 性 类 NP)，354 
composition (组 合 )，326 
computability (可 计算 性 )，299 
computable function (可 计算 函数 )，233 
computation (计算 )，228 
models (模型 )，323 
valid (有 效 )，321 
concatenation (连接 ) 
of languages (语言 的 )，18 
of strings (符号 串 的 )，15 
configuration of an automaton (自动 机 的 格局 }，25 
conjunctive normal form ( 合 取 范式 )，348 
consistent systems (一 致 系统 )，324 
context-free grammars (上 下 文 无 关 文 法 )，126 
context-free languages (上 下 文 无 关 语 言 )，125 
deterministic (确定 型 的 )，195 
context-sensitive grammars (上 上 下文 相关 文法 }，289 
context-sensitive languages (上 下 文 相关 语言 )，290 
control unit of an automaton (自动 机 的 控制 部 件 )，25 
Cook-Karp thesis (Cook-Karp 论 题 )，354 
Cook's theorem (Cook 定 理 )，355 
cycle in a graph (图 中 的 回路 )，8 
simple (简单 的 ), 8 
CYK algorithm (CYK 算 法 )，172 


D 


dead configuration ( 死 格局 ) ，52 
decidability (可 判定 性 )，299 
DeMorgan's laws ( 德 摩根 定律 )，4 
dependency graph (依赖 图 )，154 





260 


derivation (推导 )，21 
leftmost (最 左 的 )，129 
rightmost (最 右 的 )，129 
derivation tree (推导 树 )，130 
partial ( 部分)，131 
yield ( 果 )，131 
deterministic finite accepter (人 确定 型 有 穷 接受 器 )，36 
dfa (确定 型 有 穷 接 受 器 )，36 
diagonalization (对 角 线 化 )，279 
disjoint sets (不 相交 的 集合 )，4 
distinguishable sets in a dfa (确定 型 有 穷 接受 器 的 可 区 
分 的 集合 )，63 
dpda (确定 型 下 推 自动 机 )，195 


E 


empty set ( 空 集 )，4 
end markers for an lba (lba 的 端 标 记 )，271 
enumeration procedure ( 枚 举 过 程 )，268 
equivalence (等 价 性 )，7 
of automata classes ( 自动 机 类 的 )，250 
of dfa's and nfa's (dfa 和 nfa 的 )，55 
of grammars { 文法 的 ) ，24 


F 


2 


family of languages (语言 族 )，42 
final state ( 终 态 )，36 
finite automata (有 穷 自动 机 )、35 
formal languages (形式 语 吉 )，2 
functions (图 数 )，5$ 

computabie ( 可 计算 的 )，233 

domain (定义 域 )，5 

partial (部 分 的 )，5 

range ( 值 域 )，5 

total (全 ), 5 


grammar (文法 )，19 
context-free ( 上下文 无 关 的 )，126 
context-sensitive (上 下 文 相 关 的 )，289 
left-linear ( 左 线性 的 )，89 
linear (线性 的 )，91 
regular ( 七 则 的 )，89 
right-linear (布线 性 的 )，89 


simple (简单 的 )，140 
unrestricted (无 限制 的 )，283 
graph (图 ), 7 
labeled ( 带 标 记 的 )，7 
Greibach normal form ( 格 里 巴克 范式 )，149，168 


H 


halting problems for Turing machines (图 灵机 的 停机 问 
题 )，301 

halt state of a Turing machine (图 灵机 的 停机 状态 )，224 

hierarchy of language families (语言 族 的 层次 结构 )， 


275 
homomorphic image of a language (语言 的 同 态 映 像 ) , 
103 


homomorphism ( 同 态 )，103 


incompleteness theorem (不 完整 性 定理 ) ，324 
indistinguishable states in a dfa (dfa 中 的 不 可 区 分 状态 )， 
66 
inherent ambiguity (固有 一 义 性 )，144 
initial state ( 初 态 )，36 
input file (输入 文件 )，25 
instantaneous description (瞬时 描述 ) 
of a pushdown automaton (下 推 自 动机 的 )，179 
of a Turing machine (图 灵机 的 )，226 
internal states of an automaton (自动 机 的 内 部 状态 ),25， 
36 
intractabje problems ( 难 解 问题 )，354 


L 


lambda-productions (lambda 产 生 式 )，156 
language (语言 ),， 15, 17 
accepted by a dfa (dfa 接 受 的 )，38 
accepted by a dpda ( dpda 接 受 的 )，196 
accepted by an lba (lba 接 受 的 )，271 
accepted by an nfa (nfa 接 受 的 )，51 
accepted by a Turing machine (图 灵机 接受 的 )，229 
associated with regular expressions (正则 表达 式 相应 
的 ), 73 
generated by a grammar (文法 生成 的 )，21 
generated by a Post system (波斯 特 系 统 生 成 的 )， 
335 





震 绚 





Janguage families (语言 族 ) ，42 

lba (线性 有 界 自 动机 )，270 

left-linear grammar ( 左 线 性 文法 )，89 

leftmost derivation ( 最 左 推导 )，129 

tinear bounded automata (线性 有 界 自动 机 )，270 
linear grammar (线性 文法 )，91 

LL-grammars (LL 文法 )，201 

L-systems (1L- 系 统 )，340 


M 


Markov algorithm (马尔 科 夫 算 苇 )，339 
matrix grammar (和牛 阵 文法 )，338 
membership algorithm (成 册 资 格 判 定 算法 )，111 
for context-free languages (上下文 无 关 语 言 的 )、172 
for context-sensitive languages (上 下 文 相关 语言 的 )， 
293 
minimal dfa (最 小 dfa)，67 
minimaljization operator (最 小 化 运算 符 )，331 
monus ( 真 减 )，327 
move of an automaton (自动 机 的 迁移 )，25 
MPC-solution (修改 过 的 波斯 特 对 应 解 )，313 
mu-recursive functions (mu- 递 归 函 数 )，331 


N 


nfa ( 韭 确 定型 上 有 穷 接 受 器 )，48 

non-contracting grammars (不 串 收缩 文法 )，290 

nondeterministic finite accepter ( 非 确 定型 有 穷 接 受 器 )， 
47 

nondeterminism ( 韭 依 定性 )，52 

nonterminal constant ( 非 终结 常量 )，334 

normal form of a grammar (文法 的 范式 )，149，165 

NP-complete problems (NP 完全 问题 )，355 

npda ( 非 确 定型 下 推 自 动机 )，177 

null set ( 空 集 )，4 


order ( 序 ) 
proper ( 恨 )，269 
relation in a tree ( 树 中 的 关系 )，8 
P 


parsing (分 析 )，136 


287 


exhaustive search ( 穷 举 搜索 )，136 
top-down ( 自 顶 向 下 的 )，136 
path (路 径 ) 
in a graph (图 中 的 )， 8 
labeled ( 带 标记 的 )，8 
simple (简单 的 ),， 8 
pattern matching (模式 匹配 ) ，85 
PC-solution (波斯 特 对 应 解 )，313 
pda (下 推 自动 机 )，175 
Phrase-structure grammar (短语 结构 文法 )，338 
pigeonhole principle (后 入 原理 )，114 
polynomial-time reduction (多 项 式 时 间 归 约 )，355 
Post correspondence problem (波斯 特 对 应 问题 )，312 
modified (修改 过 的 )，313 
Post system (波斯 特 系统 )，334 
powerset ( 徊 集 ),，4 
primitive recursion (原始 递归 )，326 
primitive recursive functions ( 原始 递归 国 数 ) ，328 
primitive regular expressions (基本 正则 表达 式 )，72 
productions of a grammar ( 文法 的 产生 式 )，19 
program of a Turing machine ( 图 灵机 的 程序 )，224 
projector function (投影 函数 )，326 
proof techniques (证 明 方 法 )，9 
contradiction ( 反 证 靶 )，11 
induction (归纳 法 )，9 
proper order ( 良 序 )，269 
proper subset (真子 集 ), 4 
pumping lemma ( 泵 引 理 ) 
for context-free languages ( 上下文 无 关 语 言 的 )，206 
for linear languages (线性 语言 的 )，210 
for regular languages ( 正则 语言 的 )，115 
pushdown automata (下 推 自 动机 )，175 
deterministic (确定 型 的 )，195 
nondeterministic ( 非 确定 型 的 )，176 


R 


read-write head of a Turing machine (图 灵机 的 读 写 头 )， 
222 

recursive function (递归 国 数 ) ，325 

recursive language (递归 语言 )，277 

recursively enumerable languages (递归 可 枚 举 的 语言 )， 
276 .0 

reduction of states in a dfa (dfa 的 状态 化 简 )，62 

reduction ( 归 约 ) 、 

of undecidable problems (不 可 判定 问题 的 ) ，304 
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polynomial-time ( 多项式 时 间 )，355 
regular expressions ( 正则 表达 式 )，71 
regular grammar ( 正则 文法 )，89 
regular language (正则 语言 )，43 
relation (关系 )，5 
reverse ( 逆 ) 

of a language (语言 的 )，18 

of a string (符号 串 的 )，15 
rewriting systems ( 重 写 系 统 )，337 
Rice's theorem (Rice 定 理 )，311 
right-linear grammars ( 右 线性 文法 )，89 
rightmost derivation (最 右 推 导 )，129 
right quotient of languages (语言 的 右 商 )，104 
root of a tree ( 树 的 根 )，8 


S 


satisfiability problem ( 可 满足 性 问题 )，347 
semantics of programming languages (程序 设计 语言 的 语 
义 )，148 
sentence ( 句子)，17 
sentential form (人 名 型 )，21 
set (集合 )，3 
countable ( 可 数 的 )，267 
uncountable (不 可 数 的 )，267 
set operations (集合 运算 )，3 
s-grammar (简单 文法 )，140 
simulation (模拟 )，251 
space-complexity (空间 复杂 度 )，344 
stack ( 栈 )，175 
alphabet (字母 表 )}，177 
start symbol (开始 符 )，177 
standard representation for regular languages (正则 语言 
的 标准 表示 )，112 
state-entry problem (状态 进入 问题 )，304 
storage of an automaton (自动 机 的 存储 )，25 
string (符号 串 )，15 
empty ( 空 的 )，15 
length (长 度 )，15 
operations ( 操作 ) ，15 
prefix (前 绥 )，16 
suffix 〈 后缀 )，16 
subset ( 子 集 ), 4 
proper ( 真 ), 4 
substring ( 子 串 )，16 


successor function (后 继 函 数 )，326 

symmetric difference of two sets (两 个 集合 的 对 称 差 )， 
109 

syntax of a programming language (程序 设计 语言 的 语 
法 )，147 


T 


tape alphabet ( 带 字母 表 )，223 
tape of a Turing machine (图 灵机 的 带 )，222 
terminal constant (终结 常量 )，334 
terminal symbol (终结 符 )，19 
time-complexity (时 间 复 杂 度 )，344 
tracks on a tape ( 带 上 的 道 )，253 
tractable problems (可 解 问 题 ) ，343，354 
transducer (转换 器 )，26 
transition function (转移 函数 )，25，36 
extended (扩展 的 )，37 
transition graph (转换 图 )，36 
generalized (通用 的 )，81 
trap state (陷阱 状态 ) ，39 
trees ( 树 )，8 
Turing-computable function (图 灵 可 计算 函数 )，233 
Turing machine (图 灵机 )，221 
multidimensional (多 维 的 )，261 
with multiple tracks (多 道 的 )，253 
multitape (多 带 )，258 
nondeterministic ( 非 确 定型 的 )，263 
off-line (离线 )，255 
with semi-infinite tape ( 半 无 穷 带 )，253 
standard (标准 )，226 
with stay-option 〈 带 不 动 选择 的 ) ，251 
universal (通用 的 )，266 
Turing's thesis (图 灵 论 题 )，244 


U 


undecidable problem (不 可 判定 问题 )，300 
for context-free languages ( 上下文 无 关 语 言 的 )，318 
for recursively enumerable languages (递归 可 枚 举 语 
言 的 ) ，308 
unit productions (单位 产生 式 )，158 


- universal set (全 集 )，4 


universal Turing machine (通用 图 灵机 )，266 
unrestricted grammar (无 限制 文法 )，283 
useless productions (无 用 产生 式 )，153 
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V Y 
variable (变量 ) yield of a derivation tree (推导 树 的 果 )，131 
of a grammar (文法 的 )，19 
nuliable ( 可 空 的 ) ，156 Zz 
start (开始 的 )，19 
useless ( 无 用 的 )，153 zero function 〈 零 图 数 ) ，326 
W 


walk in a graph ( 图 中 的 通道 )，8 


